help SVP : récupérer les méta d'une liste d'url ?

LENEPVEU2
Invité n'ayant pas de compte PHPfrance

01 juin 2013, 23:49

bonjour,

Je m'appelle Guillaume j'habite à Montpellier,

J'ai besoin de votre aide, pour un projet très important pour moi, je suis en train d'élaborer un annuaire d'information gratuit dans le cadre d'un projet associatif,

Certains semblent dire qu'il n'est pas compliqué de récupérer les méta à partir d'une liste d'url...

Ce serait top si vous pouviez m'expliquer comment ?

J'ai une liste de 3000 adresses de sites internet dans un tableau excel;

je souhaiterais obtenir les metas de ces sites et éventuellement les titles,

comment dois-je m'y prendre exactement ?
Pourriez vous me communiquer la méthodologie, le code PHP ?

merci beaucoup de votre aide,
Guillaume

Eléphant du PHP | 267 Messages

02 juin 2013, 09:57

salut,

Dans un premier temps, si le fichier excel n'est pas au format CSV, convertis-le dans ce format
Ensuite, utilise la fonction fgetcsv pour lire ton fichier

@+
dix2

Avatar du membre
Modérateur PHPfrance
Modérateur PHPfrance | 8758 Messages

02 juin 2013, 19:21

Modération :
Merci d'utiliser un titre clair et qui correspond bien à ta demande.
Les titres contenant "HELP !", "Aidez-moi", "J'ai un problème", "Ça marche pas",...
n'apportent rien à la compréhension de ta demande.

Par ailleurs, nous savons déjà par ton message que tu as besoin d'aide. ;)

Merci de prendre le temps de lire les règlements.


Pour ce qui est de ta question tu peux utiliser simplexml ou l'extension dom qui sont prévue pour lire du xml (puise que le html c'et du xml au final ;) ).


@+
Il en faut peu pour être heureux ......

Mammouth du PHP | 1966 Messages

03 juin 2013, 11:54

ensuite si tu boucle sur chacune de tes urls, tu récupére le code source via file_get_content() et tu cherche toute les section commencant par <meta et terminant par > avec une belle petite expression régulière
Spols
pour les fan de rubik's cube ou pour les curieux ==> le portail francophone du rubik's cube

Mammouth du PHP | 619 Messages

03 juin 2013, 12:23

Bonjour,

pourquoi pas utilise la fonction get_meta_tags() de php directement ?

tu recupere les liens puis utilise cette fonction
<?php
$tags = get_meta_tags('http://forum.phpfrance.com/');

echo $tags['title'].'<br />'; 
echo $tags['author'].'<br />';     
echo $tags['keywords'].'<br />';  
echo $tags['description'].'<br />'; 
echo $tags['geo_position'].'<br />'; 

?>

affichera

Forum d'entraide PHPFrance

phpfrance, entraide, forum, serveurs, gestion, communauté, javascript, mysql, poser, venez, vos, questions, html, php, css
Forum d'entraide PHPFrance : Venez poser vos questions PHP, MySQL, HTML, CSS, Javascript, Gestion de serveurs à la communauté PHPfrance