Page 1 sur 1

Parser du HTML avec simplexml, warnings par milliers

Posté : 19 janv. 2011, 15:34
par AoSiX
Hello,

une question simple, dont la réponse pourrait être un simple "non", est t'il possible de parser de l'HTML ( la page que je test est http://www.esl.eu/fr/search/?query=Test&type=player ) avec simpleXML ? Pour la page en question, il me hurle dessus par exemple... y a t'il un mode crade pour simpleXML, ou on lui dit peut importe l'état du fichier fourni, essai d'en faire quelque chose ?

Re: Parser du HTML avec simplexml, warnings par milliers

Posté : 19 janv. 2011, 15:40
par stealth35
hello, dèjà c'est pas du XML mais du HTML, donc c'est a lire avec DOMDocument, que tu pourras toujours convertir en SimpleXML si tu veux après,
il est pas content par que le site à des fautes, tu peux déactiver les erreurs avec : libxml_use_internal_errors
libxml_use_internal_errors(true);

$doc = new DOMDocument();
$doc->loadHTMLFile('http://www.esl.eu/fr/search/?query=Test&type=player');

libxml_clear_errors();

//$xml = simplexml_import_dom($doc);

Re: Parser du HTML avec simplexml, warnings par milliers

Posté : 19 janv. 2011, 16:44
par AoSiX
Une fois de plus, ton savoir m'a aider à avancer ! :)

Je n'ai même pas eu besoin de simpleXML finalement, je me suis servi de DOMXPath. C'est juste dommage que les print_r ne sont pas très bavard avec ces éléments ;)