Analyser simplement du HTML

Mammouth du PHP | 693 Messages

15 juin 2007, 16:35

Bonjour,

J'aimerai pouvoir analyser simplement un page HTML. En l'occurence, parcourir le sujet d'un forum et récupérer juste les posts afin de faire une sauvegarde texte.

pensant que le HTML n'était qu'une version du XML, j'ai donc essayer de le parser avec SimpleXML, mais ca marche pas...

Avez vous une methode, un librairie, qui permet de faire simplement ce que je veux ?

Eléphant du PHP | 132 Messages

15 juin 2007, 23:53

Ca dépend d'énormément de paramètres. Il faut que tu définisse les balises (s'il y en a) type qui définissent le début et la fin d'un message, sachant qu'un message peut lui même contenir du code html.
Si t'arrive à trouver les balises, bah il faut que tu te retourne sur une exploitation des expressions régulières, etc...

Ton sujet est beaucoup trop vague, donne des exemples ;)
:: Kmeleon ::
CanalPC - La webradio communautaire :: Ecrivez/Enregistrez/Ecoutez !