php pour netoyer le code html pour un moteur de recherche

jeanmed
Invité n'ayant pas de compte PHPfrance

30 avr. 2007, 10:09

Bonjour,

Je dois pour un client faire un moteur de recherche il à un site fais en html uniquement. Je voudrais donc faire une boucle sur un dossier qui contient tous les fichiers HTML et recuperer le non du fichier et son contenu sans balise, et le mettre dans une base mysql ou dans un fichier txt.

Alors voici une idée du code et les parties que je pense maitriser :
// je fais une boucle while
while(le tableau qui contient les fichier html)
{

//pour chaque fichier je recupere le nom
$nomfichier=le fichier donné par la boucle;


//c'est la que je coince commant recuperer le contenu du fichier j'ai pensé à un include mais je sais pas quoi en faire. Merci de votre aide

$contenudufichier_HTML=??????????;

//avec les 2 elements je les enregistre dans ma base

$sql = 'INSERT INTO `fichiers` (`id`, `fichier`, `txt`) VALUES ('''', ''$nomfichier='', ''$contenudufichier_HTML'')';

//suivi du query ...

mysql_query($sql, $reglage) or die("message erreure sur req  ".$sql);

print ($nomfichier.' à été ajouté')

}

Avatar du membre
Administrateur PHPfrance
Administrateur PHPfrance | 9782 Messages

30 avr. 2007, 10:41

Bonjour,

Essaye avec la fonction file_get_contents()
http://fr.php.net/file_get_contents
$contenudufichier_HTML=file_get_contents($nomfichier);
Quand tout le reste a échoué, lisez le mode d'emploi...