La fonction fait partie de PECL, une série de modules à installer séparément. Je sais pas si c'est moi qui ne cherche pas bien, mais en tout cas, j'arrive pas à trouver le dll approprié. Tout ce que j'arrive à trouver c'est le fichier source en C... est-on est obligé de le compiler soi-même? C'est ...
Bon, j'ai commencé déjà à tester mon code, et les résultats ne sont pas très concluants... Pour 2 articles (de journal) qui parlent du même sujet, j'obtient un coefficient de Pearson de -0,75. Pour deux articles qui ne parlent pas de la même chose : -0,93. J'ai ensuite effectué des tests plus simple...
J'étais gentiment en train de coder ca quand j'ai eu une petite idée. Si je voulais étendre mon script à la comparaison globale de textes, c'est à dire non plus deux textes entre eux, mais un texte comparé à une multitude de textes, je pourrais stocker tous les mots du dictionnaire français dans une...
Je vais essayer de coder ça en PHP, voir un peu ce que ca donne en pratique. N'hésitez pas, si vous avez des conseils ou des suppléments d'information!
Mais, Sékiltoyai, je ne comprend plus. Tu indiques qu'il faut attribuer un nombre à chaque mot present. Or, Berzemus, indique qu'il faut uniquement creer deux tableaux, comme ceci : Phrase 1 : [1, 1, 1, 1, 1, 1, 0, 0] Phrase 2: [1, 1, 0, 0, 1, 0, 1, 1] Or, selon la methode de Berzemus, ces deux tabl...
Très bien, merci Berzemus, cette fois-ci je comprend beaucoup mieux le côté théorique du calcul. Si j'ai bien suivi, on commence par "vectoriser" les deux textes, puis on compare les deux vecteurs avec la formule de Pearson ( notamment grâce à la fonction déjà incluse dans php). Seulement,...
Donc il faut compter les occurences de chaque mot, les stocker dans deux tableaux et passer les deux tableaux dans la "moulinette" de correlation? c'est ca?
Mais, je ne comprend pas le rapport entre "distance" entre deux mots, même transformés en chiffres ou nombres, et celui de rechercher si les deux textes parlent du même du sujet... Je pense, mais je suis loin d'en être sur, qu'en calculant la distance entre deux textes, et que, si cette d...
Mais je viens de découvrir une fonction php qui fait tout juste ça, calculer le coefficient de corrélation de pearson entre deux tableaux contenant des nombres: stats_stat_correlation() Intéréssant ! Je connaissais pas! Je ne l'ais utilisé qu'en Perl, puisqu'il s'agit bien souvent de scripts qui to...
Bonjour à tous, Dans le cadre d'un petit développement perso, j'aurais besoin d'écrire un script (en PHP) qui permet de me dire tout seul, en analysant l'article, si deux articles parlent de la même chose, c'est à dire qu'ils traitent du même sujet. Comment? Ma première piste de réflexion a été de c...
Ton problème ne proviendrait tout simplement pas dudit fichier de récupération du loggin Windows qui est appelé sur chaque page? Si, si, justement c'est ce que je disais un peu plus haut. Le problème provient avec certitude de ce fichier. Mais il n'est pas appelé à chaque, uniquement à la première....