Page 1 sur 1

php pour netoyer le code html pour un moteur de recherche

Posté : 30 avr. 2007, 10:09
par jeanmed
Bonjour,

Je dois pour un client faire un moteur de recherche il à un site fais en html uniquement. Je voudrais donc faire une boucle sur un dossier qui contient tous les fichiers HTML et recuperer le non du fichier et son contenu sans balise, et le mettre dans une base mysql ou dans un fichier txt.

Alors voici une idée du code et les parties que je pense maitriser :
// je fais une boucle while
while(le tableau qui contient les fichier html)
{

//pour chaque fichier je recupere le nom
$nomfichier=le fichier donné par la boucle;


//c'est la que je coince commant recuperer le contenu du fichier j'ai pensé à un include mais je sais pas quoi en faire. Merci de votre aide

$contenudufichier_HTML=??????????;

//avec les 2 elements je les enregistre dans ma base

$sql = 'INSERT INTO `fichiers` (`id`, `fichier`, `txt`) VALUES ('''', ''$nomfichier='', ''$contenudufichier_HTML'')';

//suivi du query ...

mysql_query($sql, $reglage) or die("message erreure sur req  ".$sql);

print ($nomfichier.' à été ajouté')

}

Posté : 30 avr. 2007, 10:41
par @rthur
Bonjour,

Essaye avec la fonction file_get_contents()
http://fr.php.net/file_get_contents
$contenudufichier_HTML=file_get_contents($nomfichier);