Détecter caractères japonais

Répondre


Cette question est un moyen d’empêcher des soumissions automatisées de formulaires par des robots.
Smileys
:D :) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: =D> #-o =P~ :^o :non: :priere: 8-|
Voir plus de smileys
  Revue du sujet
 

  Étendre la vue Revue du sujet : Détecter caractères japonais

par Nagol » 09 mai 2009, 18:16

compares des chaines base64_encodé quand il s'agit de charset y'a à peu pret que ca qui te permettra d'arriver à un résultat stable

par Invité » 09 mai 2009, 15:12

Bonjour,

Le problème ne vient pas directement que je ne connaissait pas les valeurs des caractères japonais mais que le mb_ereg n'a pas l'air de fonctionner pour les caractères éxotiques (j'ai testé aussi avec le japonais et les valeurs que tu as trouvé, sans résultat: return FALSE)

Pour le japonais :

Code : Tout sélectionner

$titi = "ア州の山火事 荒れ狂"; var_dump(mb_ereg("/[\U3040-\U309F]/", $titi) );

par Calimero » 09 mai 2009, 15:09

Bonjour,

Une recherche Google m'a permis de trouver cela pour les caractères Japonais :
Japanese Hiragana : U3040 - U309F
Japanese Katakana : U30A0 - U30FF
Ajouté à l'ensemble chinois, ça devrait couvrir tout le panel des 3 syllabaires japonaises.

par @rthur » 09 mai 2009, 14:58

Bonjour,

Une recherche Google m'a permis de trouver cela pour les caractères Japonais :
Japanese Hiragana : U3040 - U309F
Japanese Katakana : U30A0 - U30FF

Détecter caractères japonais

par Djay » 09 mai 2009, 12:55

Bonjour,

J'aimerais savoir comment détecter la présence de caractères japonais dans une chaine ?
J'ai fait plusieurs essais, dont celui-ci

Code : Tout sélectionner

$test = "正则例子"; var_dump(mb_ereg("/[\u4e00-\u9fa5]/", $test) );
Et cela retourne FALSE (par contre c'est du chinois). Avec u4e00 -> u9fa5 qui représente normalement tous les caractères chinois. (Je connais pas ceux du japonais).

Si quelqu'un a des infos sur la détection des caractères "étrangers".

Merci d'avance
Djay