Je me donne donc <html><body><p>Coucou</p></body></html>
Et l'expression #<(\w+)>(?:.*?)(?!\1)</\1>#s
J'ai essayé pas mal de choses (presque tout en fait
J'ai donc essayé de partir de l'exemple du manuel PHP (qui est le même que le man de PCRE) :
#\( ( (?>[^()]+) | (?R) )* \)#x
Pour trouver les parenthèses imbriquées. Sauf que ça ne marche pas plus ...
On peut éventuellement voir une première dé-embrication (on ne voit plus le 1 dans le sous-masque) mais ça ne me convainc pas et ça ne m'aide pas à comprendre le chmilBlic.array
0 =>
array
0 => string '(1+(2+(3+4)))' (length=13)
1 =>
array
0 => string '(2+(3+4))' (length=9)
Je rappelle que c'est un petit test que je me suis donné et si je veux parser du HTML pour un objectif professionnel, je viserai DOM, SAX ou autres