Page 1 sur 1

Analyser simplement du HTML

Posté : 15 juin 2007, 16:35
par orgerix
Bonjour,

J'aimerai pouvoir analyser simplement un page HTML. En l'occurence, parcourir le sujet d'un forum et récupérer juste les posts afin de faire une sauvegarde texte.

pensant que le HTML n'était qu'une version du XML, j'ai donc essayer de le parser avec SimpleXML, mais ca marche pas...

Avez vous une methode, un librairie, qui permet de faire simplement ce que je veux ?

Posté : 15 juin 2007, 23:53
par kmeleon
Ca dépend d'énormément de paramètres. Il faut que tu définisse les balises (s'il y en a) type qui définissent le début et la fin d'un message, sachant qu'un message peut lui même contenir du code html.
Si t'arrive à trouver les balises, bah il faut que tu te retourne sur une exploitation des expressions régulières, etc...

Ton sujet est beaucoup trop vague, donne des exemples ;)