Extraire des données

Répondre


Cette question est un moyen d’empêcher des soumissions automatisées de formulaires par des robots.
Smileys
:D :) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: =D> #-o =P~ :^o :non: :priere: 8-|
Voir plus de smileys
  Revue du sujet
 

  Étendre la vue Revue du sujet : Extraire des données

Re: Extraire des données

par moogli » 13 juil. 2016, 15:35

salut,

soit tu a un document xml valide et tu utilise simpleXMLpour charger le document (avec simplexml_load_string) et faire une requête xpath dessus (pour avoir tout les a dans li) et tu obtiens un objet dont tu peux prendre les attributs (title et href).

soit tu le fait a grand coup d'expression regulière avec preg_match pour récupérer tout les liens et ensuite, pour chaque lien, récupérer les infos qui t'interesse dans le href et le title (preg_match aussi).

je te conseil ce site pour tester tes expressions régulières https://regex101.com/ et notament celle ci

@+

Extraire des données

par PaRaDiGm » 13 juil. 2016, 15:03

Bonjour,

Je souhaiterai extraire des donnees de ce code html, en voici une partie:

Code : Tout sélectionner

<li class="letter">#</li><li><a href="/fr/707/mot1/1.html" title="mot2">mot2</a><span>1234</span></li><li><a href="/fr/1042/mot3/1.html" title="mot4">mot4</a><span>4567</span></li><li><a href="/fr/5697/mot5/1.html" title="mot6">mot6</a><span>3254</span></li>etc...
Pour en obtenir ceci:

Code : Tout sélectionner

mot1,mot2 mot3,mot4 mot5,mot6 etc...
J'ai essayé avec strip_tags mais cela ne me mene pas tres loin.

Merci pour votre aide.