par
Berzemus » 08 avr. 2009, 22:50
Un moteur de recherche hein ? Voyez-vous ça... Je suis bien désolé de le dire, mais c'est autant un moteur de recherche que google une outil boursier.
Alors oui, google permet d'obtenir et de suivre le cours de la bourse, mais il y a, comment dire, des outils plus adaptés.
Pour commencer, il ne faut pas "faire" un moteur de recherche. D'abord parce que "like" n'a rien d'une fonctionnalité de recherche (c'est simplement une expression de comparaison. Il n'y a pas de classement des résultat, de calcul complexe propre à une vraie recherche, ni même de simples opérateurs booléens). Il faut d'abord savoir en utiliser un.
C'est bien dommage d'utiliser LIKE, alors que MySQL offre un magnifique
module de recherche en texte intégral. A toi la recherche avec extension de requête, de classification personnalisée, d'opérateurs booléens j'en passe et des meilleures. Bref, quelque chose qui approche de la vraie recherche.
Ensuite, c'est bien rare d'utiliser comme base de la recherche, comme source des données, la même version que celle diffusée, lisible et consultable. D'habitude, on tendrait plus vers une version "normalisée" du texte, que l'ordinateur pourra indexer facilement: on filtre les mots trop courants, on enlève tout les accents, les majuscules, etc.
On fait correspondre ces données aux données originelles par la magie des bases de données relationnelles, on effectue une recherche full-text en utilisant un input filtré et normalisé par php auparavant, et on obtient un résultat quand même plus satisfaisant, qu'on peut vraiment qualifier de recherche, même si on est encore loin de l'avoir fait, le moteur en question.
Ceci dit, ce que j'expose convient à de la recherche en texte intégral. Si on recherche un mot-clef dans une structure du type arborescence, "like" ne fera pas trop de dégâts (même si on met de côté tout ce qui est fuzzy search ou stemming). Mais le côté "normalisé" devrait quand même s'étudier.
Un moteur de recherche hein ? Voyez-vous ça... Je suis bien désolé de le dire, mais c'est autant un moteur de recherche que google une outil boursier.
Alors oui, google permet d'obtenir et de suivre le cours de la bourse, mais il y a, comment dire, des outils plus adaptés.
Pour commencer, il ne faut pas "faire" un moteur de recherche. D'abord parce que "like" n'a rien d'une fonctionnalité de recherche (c'est simplement une expression de comparaison. Il n'y a pas de classement des résultat, de calcul complexe propre à une vraie recherche, ni même de simples opérateurs booléens). Il faut d'abord savoir en utiliser un.
C'est bien dommage d'utiliser LIKE, alors que MySQL offre un magnifique [url=http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html]module de recherche en texte intégral.[/url] A toi la recherche avec extension de requête, de classification personnalisée, d'opérateurs booléens j'en passe et des meilleures. Bref, quelque chose qui approche de la vraie recherche.
Ensuite, c'est bien rare d'utiliser comme base de la recherche, comme source des données, la même version que celle diffusée, lisible et consultable. D'habitude, on tendrait plus vers une version "normalisée" du texte, que l'ordinateur pourra indexer facilement: on filtre les mots trop courants, on enlève tout les accents, les majuscules, etc.
On fait correspondre ces données aux données originelles par la magie des bases de données relationnelles, on effectue une recherche full-text en utilisant un input filtré et normalisé par php auparavant, et on obtient un résultat quand même plus satisfaisant, qu'on peut vraiment qualifier de recherche, même si on est encore loin de l'avoir fait, le moteur en question.
Ceci dit, ce que j'expose convient à de la recherche en texte intégral. Si on recherche un mot-clef dans une structure du type arborescence, "like" ne fera pas trop de dégâts (même si on met de côté tout ce qui est fuzzy search ou stemming). Mais le côté "normalisé" devrait quand même s'étudier.