Bonjour,
Voici le sujet qui me préoccupe en ce moment :
J'ai besoin d'extraire un paragraphe de classe "Legend" placé éventuellement dans une div de classe "Figure".
Une div "Figure" peut elle-même contenir différentes div (par exemple une div "Note"), dont des div "Figure_i" (figures partielles) qui peuvent aussi contenir un paragraphe "Legend".
Une structure possible peut donc être :
<div class="Figure">
[...]
xxx<div class="Figure_i>
xxx[...]
xxx<p class="Legend"> légende de la figure (a) </p>
xxx</div>
xxx<div class="Figure_i>
xxx[...]
xxx<p class="Legend"> légende de la figure (b) </p>
xxx</div>
xxx<div class="Figure_i>
xxx[...]
xxx<p class="Legend"> légende de la figure (c) </p>
xxx</div>
xxx<div class="Note">
xxx[...]
xxx</div>
<p class="Legend"> légende de l'ensemble</p>
J'ai besoin
1) de pouvoir lire l'ensemble de la div "Figure" sans que ma regex s'arrête à la première balise fermante </div>
2) de pouvoir extraire la légende associée à la div "Figure" en laissant de côté les légendes associées aux petites figures (a), (b), (c)...
Merci grandement par avance pour vos suggestions