Parser du HTML avec simplexml, warnings par milliers

Répondre


Cette question est un moyen d’empêcher des soumissions automatisées de formulaires par des robots.
Smileys
:D :) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: =D> #-o =P~ :^o :non: :priere: 8-|
Voir plus de smileys
  Revue du sujet
 

  Étendre la vue Revue du sujet : Parser du HTML avec simplexml, warnings par milliers

Re: Parser du HTML avec simplexml, warnings par milliers

par AoSiX » 19 janv. 2011, 16:44

Une fois de plus, ton savoir m'a aider à avancer ! :)

Je n'ai même pas eu besoin de simpleXML finalement, je me suis servi de DOMXPath. C'est juste dommage que les print_r ne sont pas très bavard avec ces éléments ;)

Re: Parser du HTML avec simplexml, warnings par milliers

par stealth35 » 19 janv. 2011, 15:40

hello, dèjà c'est pas du XML mais du HTML, donc c'est a lire avec DOMDocument, que tu pourras toujours convertir en SimpleXML si tu veux après,
il est pas content par que le site à des fautes, tu peux déactiver les erreurs avec : libxml_use_internal_errors
libxml_use_internal_errors(true);

$doc = new DOMDocument();
$doc->loadHTMLFile('http://www.esl.eu/fr/search/?query=Test&type=player');

libxml_clear_errors();

//$xml = simplexml_import_dom($doc);

Parser du HTML avec simplexml, warnings par milliers

par AoSiX » 19 janv. 2011, 15:34

Hello,

une question simple, dont la réponse pourrait être un simple "non", est t'il possible de parser de l'HTML ( la page que je test est http://www.esl.eu/fr/search/?query=Test&type=player ) avec simpleXML ? Pour la page en question, il me hurle dessus par exemple... y a t'il un mode crade pour simpleXML, ou on lui dit peut importe l'état du fichier fourni, essai d'en faire quelque chose ?