par
tesmet » 04 mai 2019, 17:05
Hello. C'est du texte venant d'un logiciel windows utilisant le charset cp1252 ? Car sous linux je vois "LES PIEDS DANS L\x00\x92EAU" et "CERCLE NOTRE DAME D\x00\x92ANJOU" dans la colonne de gauche et l'hexa 92 est cet apostrophe stylisé de cp1252 et je sais que les logiciels microsoft tel que word aiment les simple quotes \x91 et \x92 de même que les doubles quotes \x93 et \x94. Un
str_replace(["\x91","\x92","\x93","\x94"], ["\x27","\x27","\x22","\x22"], $le_texte_cp1252)
ciblerait cet aspect, mais il est peut-être préférable de faire la transformation avec iconv() ou similaire au lieu de utf8_encode() pour conserver le maximum d'aspects de cp1252 qu'il est possible:
$le_texte_utf8 = iconv('cp1252', 'UTF-8', $le_texte_cp1252); // plus besoin de utf8_encode() ni str_replace()
Hello. C'est du texte venant d'un logiciel windows utilisant le charset cp1252 ? Car sous linux je vois "LES PIEDS DANS L\x00\x92EAU" et "CERCLE NOTRE DAME D\x00\x92ANJOU" dans la colonne de gauche et l'hexa 92 est cet apostrophe stylisé de cp1252 et je sais que les logiciels microsoft tel que word aiment les simple quotes \x91 et \x92 de même que les doubles quotes \x93 et \x94. Un
[PHP]str_replace(["\x91","\x92","\x93","\x94"], ["\x27","\x27","\x22","\x22"], $le_texte_cp1252)[/PHP]
ciblerait cet aspect, mais il est peut-être préférable de faire la transformation avec iconv() ou similaire au lieu de utf8_encode() pour conserver le maximum d'aspects de cp1252 qu'il est possible:
[PHP]$le_texte_utf8 = iconv('cp1252', 'UTF-8', $le_texte_cp1252); // plus besoin de utf8_encode() ni str_replace()[/PHP]