Page 1 sur 1

Recupérer code source

Posté : 01 janv. 2015, 16:14
par bigbob195
Bonjour,

J'essaye de récupérer en PHP pour une expérience le code source d'un site web.
J'utilise pour cela le code ci dessous.
Cependant ce code ne fonctionne pas pour tout les sites.
Certain site ne me retourne rien (exemple: facebook)
Avez vous une idée du pourquoi et comment récupérer le code d'une autre manière ?

Merci
<?php
 
$ch = curl_init();
$timeout = 5; // set to zero for no timeout
curl_setopt ($ch, CURLOPT_URL, 'www.site.fr');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);
$lines = array();
$lines = explode("\n", $file_contents);
 
// display file line by line
foreach($lines as $line_num => $line) {
echo "Line # {$line_num} : ".htmlspecialchars($line)."<br />\n";
}
 
?>

Re: Recupérer code source

Posté : 01 janv. 2015, 16:34
par tof73
pour facebook qui bloque certains robots, il faut ajouter :
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko');