conflit de cellules
Posté : 07 mars 2006, 18:38
salut tout le monde
Je viens aux conseils mais mes questions sont tellement vagues que je suis pas sûr que vous puissiez m'aider, je tente ma chance quand meme
J'essaie de mettre un moteur de recherche sur mon site. J'ai donc pris le script moteur de recherche sur php-scripts (blork engine de zulius) qui fonctionne plutôt pas mal
après quelques modifs, y a pas de problemes il me fait mes recherches. Par contre, je l'ai inclus dans une cellule sur l'index et j'ai plusieurs problemes. Le premier est que lorsque j'arrive sur l'index, le moteur apparait bien dans la cellule mais je n'ai plus rien dans le corps du site... tout est bloqué, je vois pas d'ou ca peut venir... je vous laisse le (long) code, au cas ou vous verriez quelque chose qui expliquerait cela...
Je viens aux conseils mais mes questions sont tellement vagues que je suis pas sûr que vous puissiez m'aider, je tente ma chance quand meme
J'essaie de mettre un moteur de recherche sur mon site. J'ai donc pris le script moteur de recherche sur php-scripts (blork engine de zulius) qui fonctionne plutôt pas mal
<?
// On adapte les variables selon la version de PHP
$version_de_php=phpversion();
$version_de_php=str_replace(".","",$version_de_php);
if($version_de_php>=410){
$action = (isset($_GET['action']));
if (isset($_GET['blork']))
{
$blork = $_GET['blork'];
}
$start = (isset($_GET['start']));
$multi = (isset($_GET['multi']));
}
// Liste des codes htmls spéciaux
$caractere_special=array(
"à"=>"à",
"á"=>"á",
"â"=>"â",
"ã"=>"ã",
"ä"=>"ä",
"å"=>"å",
"æ"=>"æ",
"ç"=>"ç",
"è"=>"è",
"é"=>"é",
"ê"=>"ê",
"ë"=>"ë",
"î"=>"î",
"ï"=>"ï",
"ô"=>"ô",
"ö"=>"ö",
"ù"=>"ù",
"ú"=>"ú",
"û"=>"û",
"ü"=>"ü",
"&"=>"&",
);
// On fait les includes de base
require("blork_engine_config.php");
$version="0.23b";
// Variables par défaut
if(isset($maxmots)==""){ $maxmots="20"; }
if($maxipage==""){ $maxipage="20"; }
if($start=="" || $start=="0" ){ $start="1"; }
if(isset($blork)==""){ $blork="Chercher dans les articles"; }
$longueur_blork=strlen($blork);
$blork=trim($blork);
$blork=ereg_replace(" +", " ", $blork);
$blork2 = htmlspecialchars($blork);
$form_recherche="<form method=GET><br>
<input type=hidden value=\"go\" name=action>
<input type=text value=\"$blork2\" maxlength=30 size=15 name=blork><br>
<input type=submit value='Cherche !'><br>
</form>";
?>
<TITLE>
Recherche de <? echo($blork2); ?>
</TITLE>
<?php
// On vérifie que la recherche est correctement lancée
if($action!="go"){ echo("$form_recherche");
exit(); }
// On vérifie la longueur de la recherche
if($longueur_blork<3){
echo("Votre recherche doit comporter au moins trois caractères.<br> $form_recherche");
exit(); }
// Résultats à 0
$compteresultats="0";
$zetotal="0";
// Scan des sous dossiers sur 10 niveaux si on l'a activé
// On vérifie les sous-dossiers à scanner uniquement ici
// Ensuite on les rajoute à la liste
// Comme ça après on n'aura plus qu'a faire un scan classique
// Sur tous les dossiers de la liste
if($scan_sousdos=="on"){
$encore1=array();
$encore2=array();
foreach($dossier as $nomdos=>$d){
// Sous-dossier 1
// (...) jusqu'a sous dossier 10...
closedir($fp);
unset($fp,$nom_du_soudos,$le_soudos,$encore1,$encore2);
}}
// Passage en minuscules de la recherche
$blork=strtolower($blork);
// Maintenant on lance le scan classique sur les dossiers de la liste
// Les sous-dossiers ont été rajoutés au besoin par la fonction précédente
foreach($dossier as $nomdos=>$d){
// Sésame ouvre toi
$fp=opendir("$d");
while($file = readdir($fp)){
if($file=="." || $file==".." || is_dir($file)){ continue; }
// On ne scanne pas les fichiers exclus
if(in_array($file, $exclu)){ continue; }
// On récupère l'extension
// Merci à Frédéric Bouchery pour ce regex :-)
$ext = ereg_replace('^.*[.]([^.]*)$', '\\1', $file);
// Sélection des extensions
// On ne scanne que ces types de fichiers
if(
$ext!="html"
&& $ext!="htm"
&& $ext!="php"
&& $ext!="php3"
&& $ext!="txt"
&& $ext!="php4"
&& $ext!="gif"
&& $ext!="jpg"
&& $ext!="png"){ continue; }
// Maintenant on est sûr de devoir scanner le fichier
// On peut éxécuter tous les traitements nécessaires
// Détermination du type de fichier
// On ne vérifiera que le nom des fichiers de type "img" (image)
// alors que les fichiers de type "normal" seront entièrement retraités
// car considérés comme contenant du texte lisible par le moteur.
if($ext=="html" || $ext=="htm" || $ext=="php" || $ext=="php3" || $ext=="txt" || $ext=="php4"){
$filetype="normal"; } else{ $filetype="img"; }
// Maintenant qu'on a déterminé la place de notre fichier entre les deux types
// On va appliquer des retraitements préliminaires sur les fichiers de type "normal" uniquement
if($filetype=="normal"){
// On ouvre le contenu du fichier
$recupere_le_fichier=fopen("$d/$file","r");
$tout=fread($recupere_le_fichier,500000);
fclose($recupere_le_fichier);
// Passage en minuscules
$tout=strtolower($tout);
// On vire le html et le php
$tout=strip_tags($tout,'<title></title><script></script><head></head><style></style>');
// On récupère le titre du fichier
// Ou alors on affiche le nom avec l'extension
// Puis on supprime le titre pour ne pas fausser les résultats
if(strpos($tout,"<title>") && strpos($tout,"</title>"))
{
$titre1=strstr($tout,'<title>');
$titre2=strstr($tout,'</title>');
$titre1=str_replace("$titre2","",$titre1);
$titre1=str_replace("<title>","",$titre1);
if($titre1==""){ $titre=$file; } else{ $titre=$titre1; }
}
else{
$titre=$file; }
$titre=strtolower($titre);
unset($titre1, $titre2);
$tout = preg_replace('`<title.*?/title>`', '', $tout);
// 3 étapes ici :
// Etape 1 -
// On effectue des remplacements pour pouvoir appliquer les regex :
// 1- On remplace le saut de ligne par un espace
// 3- Les (code html pour un espace) sont remplacés par des espaces
// 4- Les doubles espaces sont remplacés par un simple espace
// Etape 2-
// On lance les regex
// 1- On vire le code entre <head> et </head> qui contient en général tout les trucs qui ne nous intéressent pas ici (feuille de style, javascript...)
// 2- On vire le javascript pour éviter les bugs au cas ou une partie nous aurait échappée
// 3- On vire les attributs de style pour les mêmes raisons
// Merci encore une fois à Frédéric Bouchery pour le regex
// Etape 3-
// On remplace le code html des accents et autres caractères spéciaux par le terme correspondant
// pour le titre ET le contenu
$tout = str_replace("\n"," ",$tout);
$tout = str_replace(" "," ",$tout);
$tout = str_replace(" "," ",$tout);
$tout = preg_replace('`<head.*?/head>`', '', $tout);
$tout = preg_replace('`<script.*?/script>`', '', $tout);
$tout = preg_replace('`<style.*?/style>`', '', $tout);
foreach($caractere_special as $caractere_code=>$caractere_traduction){
$tout = str_replace("$caractere_code","$caractere_traduction",$tout);
$titre = str_replace("$caractere_code","$caractere_traduction",$titre); }
// Fin du retraitement
}
// Maintenant le fichier a été retraité (si nécessaire),
// on peut voir s'il contient ce qu'on cherche.
// On incrémente le nb de fichiers scannés
$zetotal++;
if($zetotal>9999){ continue 2; }
// Si on trouve la recherche
if(strpos("$tout","$blork") || strpos("$file","$blork") || strpos("$titre","$blork")){
// Résultats +1
$compteresultats++;
// S'il s'agit d'un fichier de type "normal"
if($filetype=="normal"){
// On compte les occurences du terme
// Les occurences trouvées dans le titre comptent pour 10 (pire qu'au scrabble) car ils sont souvent explicites sur le contenu de la page
if (isset($total_mots))
{
$total_mots=intval(substr_count($titre,$blork)*10+$total_mots);
$total_mots=intval(substr_count($tout,$blork)+$total_mots);
}
// On crée la description
$position=strpos($tout, $blork);
$start_position=intval($position-50);
if($start_position<0){ $start_position="0"; }
$fin_position=intval($longueur_blork+100);
if($position === FALSE ){ $resume.="Terme exact introuvable dans le contenu du fichier."; }
else{
$resume="... ";
$resume.=substr($tout, $start_position, $fin_position);
$resume.=" ... ";
// On met en gras le terme recherché dans la description
$resume=str_replace($blork,"<b>$blork2</b>",$resume); }
}
// Si c'est une image ou un autre type de fichier
// On adapte la description
else{ $resume="Fichier $ext"; }
// Puis dans le titre
$titre=str_replace($blork,"<b>$blork2</b>",$titre);
// Calcul du pourcentage de pertinence
similar_text($blork, $tout, $p1);
similar_text($blork, $titre, $p2);
$p=intval($p1+$p2);
// Si le pourcentage est supérieur ou égal à 100 on le ramène à 99
// Et s'il est égal à 0 on le ramène à 1 pour qu'il puisse être réindexé (voir suite)
if($p>=100){ $p="99"; }
if($p=="0"){ $p="1"; }
// On va créer une clé identique pour chaque résultat.
// Le premier sera un "1", pour que la clé soit réindexée
// Le suivant sera le nombre d'occurences total de mots trouvés (en dizaines)
// Ensuite le pourcentage de similarité du texte + celui du titre (deux chiffres)
// Enfin le numéro du résultat (4 chiffres)
// Avec cette clé on pourra classer les résultats par ordre décroissant selon le chiffre obtenu, donc par pertinence.
// Notes :
// La clé ne doit pas commencer par 0 donc il était important de mettre en premier
// un "1", ou un chiffre supérieur à 0 en tout cas.
// La clé ne doit pas être supérieure à 8 chiffres, sinon elle ne sera pas réindexée.
// Cette bidouille me permettra par la suite avec array_unshift() de réindexer le tableau avec
// des clés numériques pour pouvoir afficher uniquement les résultats souhaités, donc j'économise
// du temps d'éxécution et des ressources par rapport à l'ancienne méthode qui consistait à créer
// un nouveau tableau. L'array_unshift() me rajoutera une valeur de clé 0 que je ne supprime pas
// parce que je pourrai ainsi gérer mes résultats à partir de 1, ce qui est plus logique.
// On ramène les occurences au maxi à 99
// Puis on rajoute un 0 devant le chiffre s'il est inférieur à 10
// Enfin on ne garde que le chiffre des dizaines
if (isset($total_mots))
{
if($total_mots>=100){ $total_mots="99"; }
if (strlen($total_mots)==1){
$total_mots=str_repeat("0",2-strlen($total_mots)).$total_mots; }
$total_mots=substr($total_mots, 0, 1);
}
// Idem pour les pourcentages
if (strlen($p)==1){
$p=str_repeat("0",2-strlen($p)).$p; }
// Et enfin le numéro du résultat
$compteresultats2=$compteresultats;
if (strlen($compteresultats2)<4){
$compteresultats2=str_repeat("0",4-strlen($compteresultats2)).$compteresultats2; }
// On met la première lettre du titre en majuscules
$titre=ucfirst($titre);
// URL par défaut pour les fichiers
// On vire l'extension si besoin
if($montre_ext=="off" && $filetype!="img"){
$file=str_replace(".$ext","",$file); }
if($go2url==""){ $go_2_url="$d/$file"; }
else{
$go_2_url="$go2url";
$go_2_url=str_replace("[dossier]",$d,$go_2_url);
$go_2_url=str_replace("[fichier]",$file,$go_2_url); }
// Source du résultat
$src=" <A href=\"$go_2_url\">$titre</A> <br>
$resume
";
// On enregistre
$zeresults["1".(isset($total_mots))."".$p."".$compteresultats2]="$src";
// On remet a zéro histoire d'éviter des doublons
unset(
$compteresultats2,
$tout,
$resume,
$src,
$titre,
$filetype,
$p,
$p1,
$p2,
$file,
$ext,
$total_mots,
$register
);
}}
// On referme
// Sésame ferme toi
closedir($fp);
unset($tout,$filetype,$fp,$ext); }
// Si on a des résultats
// On les classe par ordre décroissant de pertinence
// Ensuite on lance un array_unshift() qui réindexe le tableau
// ce qui nous permet d'avoir des clés numériques et de gérer les résultats à partir de 1
// Pour de plus amples explications vous pouvez voir un peu plus haut
// ou me contacter, j'essaierai de vous expliquer ça en détail.
if($compteresultats>0){
krsort($zeresults);
array_unshift($zeresults,"rien"); }
// On définit les différentes variables qui serviront pour la barre de navigation
if($start=="1" && $compteresultats=="0" ){ $start="0"; }
$pourvoir=intval($start+$maxipage-1);
if($pourvoir>$compteresultats){ $pourvoir=$compteresultats; }
$finstart=intval($compteresultats-$maxipage+1);
$prevbarre=intval($start-$maxipage);
$nextbarre=intval($start+$maxipage);
$nb_barre="1";
$compte_affichage=$start;
// Changement du texte selon les résultats
// Entre singulier et pluriel
$rs=" résultat trouvé ";
$fich=" fichier";
if($compteresultats>1){ $rs=" résultats trouvés "; }
if($zetotal>1){ $fich=" fichiers"; }
// Maintenant on commence l'affichage
echo("Résultats de votre recherche pour <b>$blork2</b><br> $compteresultats $rs :");
if($compteresultats>0){ echo("$form_recherche"); }
// On sélectionne les éléments du tableau de résultat à afficher et on les lance
if($compteresultats>0){
foreach($zeresults as $key=>$value){
if($key>=$start && $key<$nextbarre){
echo("<br><br>
$value");
$compte_affichage++; }} }
// Et si on a trop de résultats par rapport au nombre à afficher dans la page on met la barre de navigation
if($compteresultats>$maxipage){
echo("<p align=center><br>");
if($start!="1"){
echo("<A href=\"engine.php?blork=$blork&action=go&choix=$choix\"><< Début</A> <A href=\"engine.php?blork=$blork&action=go&start=$prevbarre&choix=$choix\">< Page précédente</A> ("); }
else{ echo("<< Début < Page précédente ("); }
for($barre=1;$barre<$compteresultats;){
$finbarre=intval($compteresultats-$barre);
echo(" <A href=\"engine.php?blork=$blork&action=go&start=$barre&choix=$choix\">$nb_barre</A> ");
$nb_barre++;
$barre=intval($barre+$maxipage); }
if($start<$finstart){ echo(") <A href=\"engine.php?blork=$blork&action=go&start=$nextbarre&choix=$choix\">Page suivante ></A> <A href=\"engine.php?blork=$blork&action=go&start=$finstart&choix=$choix\">Fin >></A>"); }
else{ echo(") Page suivante > Fin >>"); }
echo("</p>");
}
if($compteresultats=="0"){
echo("<br><center> Votre recherche sur le terme <b>$blork2</b> n'a donné aucun résultat. Essayez d'élargir votre recherche en y mettant moins de mots ou vérifiez son orthographe.</center>");
}
else{
echo("<p align=center><br>$compteresultats $rs sur $zetotal $fich.</p>"); }
?>