J'ai besoin de repérer le contenu de certaines balises html.
Par exemple, je veux pouvoir établir une table des figures, sachant que chaque figure est repérée comme suit :
<p class="Legende">Légende de la figure</p>
J'utilise donc une fonction preg_match_all pour obtenir une table de toutes les occurrences <p class="Legende">...</p> :preg_match_all("/<p class=\"Legende\"([^>]+)>(.*)<\/p>/U", $document, $figures, PREG_SET_ORDER);
(la première parenthèse correspond à d'éventuels attributs ; la deuxième correspond au libellé de la légende)Le problème, c'est que le fichier html a été enregistré avec un paquet de sauts de ligne automatiques sur lesquels je n'ai aucune maîtrise.
Le contenu des balises mentionnées peut donc être réparti sur deux lignes. Dans ce cas, preg_match_all ne repère pas l'occurrence dans la mesure où il ne voit pas la balise fermante </p> qui se trouve sur la deuxième ligne.
Comment puis-je donc repérer toutes les occurrences <p class="Legende">...</p>, que le texte de la légende soit contenu sur une ligne ou sur deux (voire plusieurs ) lignes.
Merci d'avance pour votre aide