Bonjour à toutes et à tous ami(e)s développeurs
Je poste aujourd'hui ce message car je rencontre un problème qui me semble non résolvable.
J'ai développé une petite fonction basée sur la fonction PHP : cURL, afin de récupérer le code source d'une page.
<?php
function recuperer_code_source($p_url)
{
// INITIALISATION D'UNE SESSION cURL
$ch = curl_init();
// OPTIONS DE LA SESSION cURL
curl_setopt($ch, CURLOPT_URL, $p_url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);
curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.fr');
// EXÉCUTION DE LA SESSION cURL
$code_source = curl_exec($ch);
// FERMETURE DE LA SESSION cURL
curl_close($ch);
// RETOUR DE LA FONCTION
return $code_source;
}
?>
J'ai remarqué que sur les pages contenant seulement du HTML (ou du HTML généré via du PHP) il n'y avait pas de problème lors de la récupération du code source.
En effet, le PHP étant exécuté côté serveur, le serveur renvoie le code HTML déjà généré, code récupéré facilement par ma fonction.
En revanche et c'est là que c'est fâchant, lorsqu'une page voit son code HTML généré via du JavaScript il devient impossible de récupérer ce code source via la fonction cURL, car le JavaScript est exécuté côté client, et donc... on ne récupère que le code HTML qui n'a pas été généré par le JavaScript en question...
J'aimerais donc savoir, si il est possible de récupérer le code source d'une page (via un script PHP), après que celle-ci ait été générée via le code JavaScript qu'elle contient ? Si oui, pourriez-vous m'indiquer quelle méthode je dois employer ?
Je vous remercie d'avance de vos réponses qui je l'espère me convaincront que ce n'est pas chose impossible !
