Eléphant du PHP |
383 Messages
27 janv. 2006, 02:03
la méthode que j'utilise ( dont personne ne m'a encore demontré que c'etait une connerie ) est d'indexer chaque article dans lequel je veux faires des recehrches. ainsi, pour chaque mot qui apparait dans un article, je stocke : ce mot en minuscule et sans accents, l'id de l'article et le nombre de fois qu'il apparait dans l'article. les avntages :
- plus de probleme de casse, d'accents ou de code html ( si tu as télé dans ta base et qu'on cherche tele, il se passe quoi.. )
- j'elimine de l'index les mots inutiles ( plus rapide, environ 40% de volume de texte a chercher en moins )
- comme un mot qui apparait plusieurs fois dans un article n'apparait qu'une fois dans mon index -> encore plus rapide
- comme je fais du coup une recherche en texte exact et pas en "contient", et que l'index est trie -> encore plus rapide

- j'ai une notion de score ( simple, mais qui pourrait etre ameliorée ) qui me permet de trier les resultats.