Extraire des données

Petit nouveau ! | 7 Messages

13 juil. 2016, 15:03

Bonjour,

Je souhaiterai extraire des donnees de ce code html, en voici une partie:

Code : Tout sélectionner

<li class="letter">#</li><li><a href="/fr/707/mot1/1.html" title="mot2">mot2</a><span>1234</span></li><li><a href="/fr/1042/mot3/1.html" title="mot4">mot4</a><span>4567</span></li><li><a href="/fr/5697/mot5/1.html" title="mot6">mot6</a><span>3254</span></li>etc...
Pour en obtenir ceci:

Code : Tout sélectionner

mot1,mot2 mot3,mot4 mot5,mot6 etc...
J'ai essayé avec strip_tags mais cela ne me mene pas tres loin.

Merci pour votre aide.

Avatar du membre
Modérateur PHPfrance
Modérateur PHPfrance | 8758 Messages

13 juil. 2016, 15:35

salut,

soit tu a un document xml valide et tu utilise simpleXMLpour charger le document (avec simplexml_load_string) et faire une requête xpath dessus (pour avoir tout les a dans li) et tu obtiens un objet dont tu peux prendre les attributs (title et href).

soit tu le fait a grand coup d'expression regulière avec preg_match pour récupérer tout les liens et ensuite, pour chaque lien, récupérer les infos qui t'interesse dans le href et le title (preg_match aussi).

je te conseil ce site pour tester tes expressions régulières https://regex101.com/ et notament celle ci

@+
Il en faut peu pour être heureux ......