Aspirateur de site, en utilisant php
Posté : 23 mai 2013, 12:00
Bonjour à tous,
Je suis à la recherche de pistes concernant la réalisation d'un fichier php destiné à aspirer l'intégralité d'un site (html uniquement) ainsi que sa structure, depuis une URL donnée vers mon ftp.
Je cherche sensiblement à reproduire de manière automatisé une aspiration HTTRACK et l'upload des fichiers aspirés vers un FTP.
Après plusieurs recherches il me semble que les modules tels que cURL ou file_get_content en php devraient largement suffire. Je suis cependant étonné de n'avoir rien trouvé d'existant qui permettrait d'aspirer l'architecture entière d'un site et non juste une page, j'ai donc de gros doutes.
Afin de ne pas me limiter dans la recherche de solution, voici pourquoi je cherche à réaliser cette aspiration :
- j'ai un site vitrine en anglais à une adresse .com
- j'utilise ensuite une solution en ligne de traduction par post-édition qui me permet d'avoir, à une adresse donnée, un site dans la langue de mon choix.
- ces sites traduits en temps réel, sont extrêmement lents lors de la navigation, du fait de l'empilement de requêtes nécessaire à leur composition.
- je cherche donc très simplement à aspirer le site traduit pour le ramener sur mon ftp OVH.
- à hauteur d'une aspiration par semaine, pour bientôt une dizaine de langue, l'option HTTRACK et upload manuel devient beaucoup trop contraignante.
Je reste néophyte dans le domaine je suis donc ouvert à tous conseil pouvant répondre à ce besoin, avec les moyens limités dont je dispose (pas de serveur linux).
Pouvez vous m'aider? Je vous remercie d'avance.
Je suis à la recherche de pistes concernant la réalisation d'un fichier php destiné à aspirer l'intégralité d'un site (html uniquement) ainsi que sa structure, depuis une URL donnée vers mon ftp.
Je cherche sensiblement à reproduire de manière automatisé une aspiration HTTRACK et l'upload des fichiers aspirés vers un FTP.
Après plusieurs recherches il me semble que les modules tels que cURL ou file_get_content en php devraient largement suffire. Je suis cependant étonné de n'avoir rien trouvé d'existant qui permettrait d'aspirer l'architecture entière d'un site et non juste une page, j'ai donc de gros doutes.
Afin de ne pas me limiter dans la recherche de solution, voici pourquoi je cherche à réaliser cette aspiration :
- j'ai un site vitrine en anglais à une adresse .com
- j'utilise ensuite une solution en ligne de traduction par post-édition qui me permet d'avoir, à une adresse donnée, un site dans la langue de mon choix.
- ces sites traduits en temps réel, sont extrêmement lents lors de la navigation, du fait de l'empilement de requêtes nécessaire à leur composition.
- je cherche donc très simplement à aspirer le site traduit pour le ramener sur mon ftp OVH.
- à hauteur d'une aspiration par semaine, pour bientôt une dizaine de langue, l'option HTTRACK et upload manuel devient beaucoup trop contraignante.
Je reste néophyte dans le domaine je suis donc ouvert à tous conseil pouvant répondre à ce besoin, avec les moyens limités dont je dispose (pas de serveur linux).
Pouvez vous m'aider? Je vous remercie d'avance.