Analyser simplement du HTML

Répondre


Cette question est un moyen d’empêcher des soumissions automatisées de formulaires par des robots.
Smileys
:D :) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: =D> #-o =P~ :^o :non: :priere: 8-|
Voir plus de smileys
  Revue du sujet
 

  Étendre la vue Revue du sujet : Analyser simplement du HTML

par kmeleon » 15 juin 2007, 23:53

Ca dépend d'énormément de paramètres. Il faut que tu définisse les balises (s'il y en a) type qui définissent le début et la fin d'un message, sachant qu'un message peut lui même contenir du code html.
Si t'arrive à trouver les balises, bah il faut que tu te retourne sur une exploitation des expressions régulières, etc...

Ton sujet est beaucoup trop vague, donne des exemples ;)

Analyser simplement du HTML

par orgerix » 15 juin 2007, 16:35

Bonjour,

J'aimerai pouvoir analyser simplement un page HTML. En l'occurence, parcourir le sujet d'un forum et récupérer juste les posts afin de faire une sauvegarde texte.

pensant que le HTML n'était qu'une version du XML, j'ai donc essayer de le parser avec SimpleXML, mais ca marche pas...

Avez vous une methode, un librairie, qui permet de faire simplement ce que je veux ?