Moteur de recherches.
Posté : 24 août 2007, 19:20
Bonjour 
Je reviens de vacances, et comme j'avais de la route, j'ai pensé à prendre un livre à la BU (Bibliothèque Universitaire) histoire de m'occuper. Je pensais naïvement que la mention 2ième et 3ième cycle universitaire signifiait licence 2ième et 3ième année, mais non, c'est juste master et doctorat. Honte sur moi. Je rentre en licence 2ième année, un sacré décallage. Mais ça ne m'a pas arrêté. Je me suis quand même attaquer au livre.
Il est carrément intéressant, même si un peu dur tout de même. Il traite de l'Algorithmique du Texte. Et ça m'a donné pleins d'idées pour ne rien vous cacher
.
J'aimerais ici qu'on réfléchisse sur différentes façons d'améliorer un moteur de recherches interne à un site. Pour pouvoir s'exprimer plus facilement, on va utiliser des notations formelles. On va utiliser 2 notations simples pour l'instant : X serait le motif, et y serait le mot qui contient l'information qu'on recherche.
Bien. Commençons. Quand on veut faire un moteur de recherches, on utilise le plus souvent la commande LIKE d'SQL. Mais cette commande est beaucoup trop restrictive. Même si l'utilisation du symbole % permet de rechercher un occurence dans une autre, ce n'est pas encore le top. On pourrait alors utiliser des expressions régulières sur toutes les données de la table. Mais là encore, les expressions régulières ne seraient pas assez puissante.
Un moteur de recherches doit pouvoir permettre de chercher X dans y si :
Enfin, j'aimerais savoir qu'est-ce qu'il faudrait dans un bon moteur de recherches interne au site ? Est-ce qu'on en aurait réellement besoin ? Etc etc.
Je reviens de vacances, et comme j'avais de la route, j'ai pensé à prendre un livre à la BU (Bibliothèque Universitaire) histoire de m'occuper. Je pensais naïvement que la mention 2ième et 3ième cycle universitaire signifiait licence 2ième et 3ième année, mais non, c'est juste master et doctorat. Honte sur moi. Je rentre en licence 2ième année, un sacré décallage. Mais ça ne m'a pas arrêté. Je me suis quand même attaquer au livre.
Il est carrément intéressant, même si un peu dur tout de même. Il traite de l'Algorithmique du Texte. Et ça m'a donné pleins d'idées pour ne rien vous cacher
J'aimerais ici qu'on réfléchisse sur différentes façons d'améliorer un moteur de recherches interne à un site. Pour pouvoir s'exprimer plus facilement, on va utiliser des notations formelles. On va utiliser 2 notations simples pour l'instant : X serait le motif, et y serait le mot qui contient l'information qu'on recherche.
Bien. Commençons. Quand on veut faire un moteur de recherches, on utilise le plus souvent la commande LIKE d'SQL. Mais cette commande est beaucoup trop restrictive. Même si l'utilisation du symbole % permet de rechercher un occurence dans une autre, ce n'est pas encore le top. On pourrait alors utiliser des expressions régulières sur toutes les données de la table. Mais là encore, les expressions régulières ne seraient pas assez puissante.
Un moteur de recherches doit pouvoir permettre de chercher X dans y si :
- X est un mot de y ;
X se trouve dans un mot de y ;
X s'approche d'un mot de y.
Enfin, j'aimerais savoir qu'est-ce qu'il faudrait dans un bon moteur de recherches interne au site ? Est-ce qu'on en aurait réellement besoin ? Etc etc.