Détecter caractères japonais

Petit nouveau ! | 3 Messages

09 mai 2009, 12:55

Bonjour,

J'aimerais savoir comment détecter la présence de caractères japonais dans une chaine ?
J'ai fait plusieurs essais, dont celui-ci

Code : Tout sélectionner

$test = "正则例子"; var_dump(mb_ereg("/[\u4e00-\u9fa5]/", $test) );
Et cela retourne FALSE (par contre c'est du chinois). Avec u4e00 -> u9fa5 qui représente normalement tous les caractères chinois. (Je connais pas ceux du japonais).

Si quelqu'un a des infos sur la détection des caractères "étrangers".

Merci d'avance
Djay

Avatar du membre
Administrateur PHPfrance
Administrateur PHPfrance | 9782 Messages

09 mai 2009, 14:58

Bonjour,

Une recherche Google m'a permis de trouver cela pour les caractères Japonais :
Japanese Hiragana : U3040 - U309F
Japanese Katakana : U30A0 - U30FF
Quand tout le reste a échoué, lisez le mode d'emploi...

ViPHP
ViPHP | 2287 Messages

09 mai 2009, 15:09

Bonjour,

Une recherche Google m'a permis de trouver cela pour les caractères Japonais :
Japanese Hiragana : U3040 - U309F
Japanese Katakana : U30A0 - U30FF
Ajouté à l'ensemble chinois, ça devrait couvrir tout le panel des 3 syllabaires japonaises.
if(!@work()){ Nespresso(); } else { what(); }
______________________________

Invité
Invité n'ayant pas de compte PHPfrance

09 mai 2009, 15:12

Bonjour,

Le problème ne vient pas directement que je ne connaissait pas les valeurs des caractères japonais mais que le mb_ereg n'a pas l'air de fonctionner pour les caractères éxotiques (j'ai testé aussi avec le japonais et les valeurs que tu as trouvé, sans résultat: return FALSE)

Pour le japonais :

Code : Tout sélectionner

$titi = "ア州の山火事 荒れ狂"; var_dump(mb_ereg("/[\U3040-\U309F]/", $titi) );

ViPHP
ViPHP | 3300 Messages

09 mai 2009, 18:16

compares des chaines base64_encodé quand il s'agit de charset y'a à peu pret que ca qui te permettra d'arriver à un résultat stable
Fait du php depuis que ca existe ou presque :)