Page 1 sur 1

Récupération des métas, différents problèmes...

Posté : 19 nov. 2007, 17:49
par djmustru
Bonjour,

je cherche à récupérer les informations d'une balise situé dans la balise description des méta tags de site mais je suis confrontés a plusieurs problèmes liés aux accents. En effet, on fonction du site que je récupère, j'ai des problème de récupération d'acents et caractère spéciaux (je pense que cela viens du cadage...)

Exemples :


Actualités, moteur de recherche, email gratuit, communautés, shopping, voyages, outils de personnalisation : découvrez ou redécouvrez Yahoo!, le premier portail Internet mondial
ou
Actualit?s, moteur de recherche, email gratuit, communaut?s, shopping, voyages, outils de personnalisation : d?couvrez ou re
Quelqu'un a deja été confronté a ce problème ??

Merci d'avance.

Posté : 19 nov. 2007, 20:25
par Ryle
Lorsque tu récupères les données d'un site, tu vas les récupérer dans l'encodage dans lequel elle se trouve. Le navigateur va les afficher correctement car il va se baser sur le charset spécifié dans un méta, ex :

Code : Tout sélectionner

<META http-equiv="Content-Type" Content="text/html; charset=ISO-8859-15">
Il te faut donc faire de même pour savoir comment est encodé le code que tu récupères. Le premier que tu nous as posté par exemple est en utf8. Tu peux donc soit spécifier le charset adéquat, soit utiliser la fonction utf8_decode() pour le décoder et l'obtenir en iso :)

Posté : 20 nov. 2007, 09:26
par djmustru
Merci beaucoup pour ces informations claires, j'ai bien compris le principe.

Bonne journée