Page 1 sur 1

Lire le contenu d'un site contenant du JS

Posté : 12 nov. 2014, 17:56
par Pouet le chat
Bonjour,

Je souhaiterai analyser le contenu d'une URL distante, mais je bloque sur un point assez simple mais pour lequel je ne trouve aucune solution.

Le site en question contient du JavaScript, et lorsque je récupère les données du site, je récupère le code source, ce qui ne me convient pas car je souhaite récupérer les données telles qu'elles s'affiche dans le navigateur internet de l'utilisateur.

Auriez vous une solution car je n'en ai pas trouvé.

Merci pour vos lumières.

Re: Lire le contenu d'un site contenant du JS

Posté : 12 nov. 2014, 20:03
par xTG
Ce n'est en aucune façon simple.
Il te faut pour cela interpréter le javascript.
Donc redévelopper un navigateur internet qui tournerai sur un serveur...
Bref c'est pas à la portée de toute le monde. ;)

Une solution réaliste ?
Contactes l'auteur du site pour qu'il mette en place un webservice pour que tu puisses récupérer les informations.

Re: Lire le contenu d'un site contenant du JS

Posté : 13 nov. 2014, 08:56
par Nestecha
Avec cURL, ça doit être faisable non ?

Re: Lire le contenu d'un site contenant du JS

Posté : 13 nov. 2014, 11:12
par xTG
Non, Curl n'interprète pas le JS.
Il ne fait qu'une requête HTTP.

Re: Lire le contenu d'un site contenant du JS

Posté : 13 nov. 2014, 15:22
par Pouet le chat
Merci pour vos réponses, je me doutais que c'était complexe au regard de mes recherches.

La solution palliative que j'ai utilisé reste classique :
- J'ai utilisé sur le site en question l'outil d'interprétation de Chrome pour isolé l’évent appelé pour la génération des données qui m’intéresse,
- J'ai créer un flux attaquant ce JSON tout en s'identifiant,
- Je réinterprète le flux car les données sont bruts,

Je suis sur l'étape 3, ça le fait donc...

Merci pour votre réactivité.