par
sirakawa » 22 févr. 2014, 14:49
Bjr,
Tu pourrais faire une recherche sur le plagiat (il y a eu des trucs entre autres à polytechnique).
Mais il y a en php plusieurs fonctions qui font ça dont levenshtein, metaphone, similar_texte. soundex qui serait très bien si on pouvait la forcer à prendre en compte le français, ce que ne fait pas php, mais que permet:
http://algor.chez.com/soundex/soundex.htm
Je m'en étais servi pour identifier des noms de personnes après des frappes plus ou moins fausses.
<?PHP
function soundex_fr($mot)
{
mb_internal_encoding ("utf-8");
$consonnes = array (
"b",
"p" ,
"c",
"k",
"q",
"d",
"t",
"l",
"m",
"n",
"r",
"g",
"j",
"x",
"z",
"s",
"f",
"v",
"a",
"â",
"à",
"ä",
"e",
"é",
"è",
"ë",
"ë",
"i",
"î",
"i",
"o",
"ô",
"ö",
"u",
"û",
"ü",
"y",
);
$nombres = array (
1,
1,
2,
2,
2,
3,
3,
4,
5,
5,
6,
7,
7,
8,
8,
8,
9,
9,
);
$mot = mb_strtolower(trim($mot));
print "$mot<br>";
$sound = str_replace ($consonnes, $nombres, $mot);
return $sound;
}
echo (soundex_fr("câäauitécui"));
?>
Bjr,
Tu pourrais faire une recherche sur le plagiat (il y a eu des trucs entre autres à polytechnique).
Mais il y a en php plusieurs fonctions qui font ça dont levenshtein, metaphone, similar_texte. soundex qui serait très bien si on pouvait la forcer à prendre en compte le français, ce que ne fait pas php, mais que permet:
http://algor.chez.com/soundex/soundex.htm
Je m'en étais servi pour identifier des noms de personnes après des frappes plus ou moins fausses.
[php]<?PHP
function soundex_fr($mot)
{
mb_internal_encoding ("utf-8");
$consonnes = array (
"b",
"p" ,
"c",
"k",
"q",
"d",
"t",
"l",
"m",
"n",
"r",
"g",
"j",
"x",
"z",
"s",
"f",
"v",
"a",
"â",
"à",
"ä",
"e",
"é",
"è",
"ë",
"ë",
"i",
"î",
"i",
"o",
"ô",
"ö",
"u",
"û",
"ü",
"y",
);
$nombres = array (
1,
1,
2,
2,
2,
3,
3,
4,
5,
5,
6,
7,
7,
8,
8,
8,
9,
9,
);
$mot = mb_strtolower(trim($mot));
print "$mot<br>";
$sound = str_replace ($consonnes, $nombres, $mot);
return $sound;
}
echo (soundex_fr("câäauitécui"));
?>[/php]