Algorithme de mon moteur de sites – Full-text, votre avis
Posté : 15 août 2012, 18:13
Bonjour,
J'ai élaboré un moteur de sites et je souhaite connaître votre avis sur ce qui me préoccupe..
La recherche s'effectue sur le titre du site, la description, les mots clefs, l'url et le texte html de toute la page concernée du site soumis (je le récupère au préalable et il est mis à jour tous les 48h00-72h00.
Lors d'une recherche sur mon moteur, j'effectue un calcul sur la "relevance" pour y indiquer l'ordre d'affichage selon les résultats (même si mon code n'est pas très académique, le tout fonctionne très bien..)
Bout de mon code
A mon sens, il me semble que je dois donner de l'importance d'abord au titre du site, puis à l'url, à la description, au texte html et pour finir sur les mots clefs
Quelle valeur donneriez-vous ?
Actuellement….
Titre = 2.25
Description = 1.25
Mots-clefs = 1.05
url (url) = 1.50
Texte html = 1.10
Votre avis ?
Titre = ??
Description = ??
Mots-clefs = ??
url (url) = ??
Texte html = ??
D'avance merci pour votre aide
Cordialement
Yule
J'ai élaboré un moteur de sites et je souhaite connaître votre avis sur ce qui me préoccupe..
La recherche s'effectue sur le titre du site, la description, les mots clefs, l'url et le texte html de toute la page concernée du site soumis (je le récupère au préalable et il est mis à jour tous les 48h00-72h00.
Lors d'une recherche sur mon moteur, j'effectue un calcul sur la "relevance" pour y indiquer l'ordre d'affichage selon les résultats (même si mon code n'est pas très académique, le tout fonctionne très bien..)
Bout de mon code
$query = "SELECT id, nomsite, description, mcles, url, urlrss, urlaff, texte, (
(2.25 * (MATCH (nomsite) AGAINST (".$qo1."".$out."".$qo2." IN BOOLEAN MODE)))
+ (1.25 * (MATCH (description) AGAINST (".$qo1."".$out."".$qo2." IN BOOLEAN MODE)))
+ (1.05 * (MATCH (mcles) AGAINST (".$qo1."".$out."".$qo2." IN BOOLEAN MODE)))
+ (1.50 * (MATCH (url) AGAINST (".$qo1."".$out."".$qo2." IN BOOLEAN MODE)))
+ (1.10 * (MATCH (texte) AGAINST (".$qo1."".$out."".$qo2." IN BOOLEAN MODE))) ) AS relevance FROM moteur_sites
WHERE ( MATCH (nomsite, description, mcles, url, texte) AGAINST (".$qo1."".$out."".$qo2." IN BOOLEAN MODE) ) AND valid='1' $fil HAVING relevance > 0 ORDER BY relevance DESC LIMIT $debut,$limit";
Personnellement, je n'arrive pas à trouver le bon compromis…savoir ou donner le bon poids (valeur) sur mon calcul et surtout si tout est logique… j'avoue que je patauge un peu sur le choix le plus judicieux ?A mon sens, il me semble que je dois donner de l'importance d'abord au titre du site, puis à l'url, à la description, au texte html et pour finir sur les mots clefs
Quelle valeur donneriez-vous ?
Actuellement….
Titre = 2.25
Description = 1.25
Mots-clefs = 1.05
url (url) = 1.50
Texte html = 1.10
Votre avis ?
Titre = ??
Description = ??
Mots-clefs = ??
url (url) = ??
Texte html = ??
D'avance merci pour votre aide
Cordialement
Yule