Récupération des métas, différents problèmes...

Eléphant du PHP | 114 Messages

19 nov. 2007, 17:49

Bonjour,

je cherche à récupérer les informations d'une balise situé dans la balise description des méta tags de site mais je suis confrontés a plusieurs problèmes liés aux accents. En effet, on fonction du site que je récupère, j'ai des problème de récupération d'acents et caractère spéciaux (je pense que cela viens du cadage...)

Exemples :


Actualités, moteur de recherche, email gratuit, communautés, shopping, voyages, outils de personnalisation : découvrez ou redécouvrez Yahoo!, le premier portail Internet mondial
ou
Actualit?s, moteur de recherche, email gratuit, communaut?s, shopping, voyages, outils de personnalisation : d?couvrez ou re
Quelqu'un a deja été confronté a ce problème ??

Merci d'avance.

Avatar du membre
Modérateur PHPfrance
Modérateur PHPfrance | 10684 Messages

19 nov. 2007, 20:25

Lorsque tu récupères les données d'un site, tu vas les récupérer dans l'encodage dans lequel elle se trouve. Le navigateur va les afficher correctement car il va se baser sur le charset spécifié dans un méta, ex :

Code : Tout sélectionner

<META http-equiv="Content-Type" Content="text/html; charset=ISO-8859-15">
Il te faut donc faire de même pour savoir comment est encodé le code que tu récupères. Le premier que tu nous as posté par exemple est en utf8. Tu peux donc soit spécifier le charset adéquat, soit utiliser la fonction utf8_decode() pour le décoder et l'obtenir en iso :)
Ce n'est pas en améliorant la bougie que l'on a inventé l'ampoule...

Eléphant du PHP | 114 Messages

20 nov. 2007, 09:26

Merci beaucoup pour ces informations claires, j'ai bien compris le principe.

Bonne journée