Page 1 sur 1
simple html dom
Posté : 21 janv. 2016, 15:30
par azizss
Bonjour,
je vient vers vous pour de l'aide.
Je cherche a réaliser un outils qui permet de récupérer le comptenue d'un site dans un XML.
Cela en PARSING soi "simple html dom" en php.
Mais j'ai utiliser cette fonction en 1er
Je cherche a récupérer chaque donnée et a les placer dans un XML que je voudrais transformer en CSV.
Pouvez-vous m'aider a trouver le bonne solution et la manière dans la quel je dois faire pour réaliser cela.
Je cherche a faire un script générique qui puis fonctionner avec tous le site comme IMPORT.IO
Merci de votre aide
Re: simple html dom
Posté : 21 janv. 2016, 17:52
par @rthur
Bonjour,
Je cherche a faire un script générique qui puis fonctionner avec tous le site comme IMPORT.IO
C'est très compliqué et cela demande des compétences importantes pour pouvoir réaliser un outil qui soit équivalent à leur solution et qui fonctionne sur n'importe quel site.
KriSpiX t'as déjà donné des liens vers des exemples, qu'as tu essayé ? Où bloques-tu ?
php-debutant/parsing-t275286.html
Re: simple html dom
Posté : 22 janv. 2016, 11:15
par azizss
Déjà merci @rthur pour ta réponse, c'est bien ce que je me suis dit.
Mais si je crée un outils a qui permet de sélectionner les zones de texte et autre partie.
Cela est-il possible ? avec quel outils ?
Je bloque sur la manière de récupérer les données et les structurer, même manuellement.
En 1er lieux j'aimerai les récupérer par zones que je voudrais.
Je n'y arrive pas je récupérer tous, et tellement utiliser d'exemple que je suis perdue.
Merci de m'aider @rthur j'aimerai trouver un chemin pour me diriger vers une solution.
Re: simple html dom
Posté : 22 janv. 2016, 13:03
par @rthur
Tu as 2 points à gérer :
- le front avec l'interface pour tes utilisateurs, et là c'est du HTML/javascript voir une app dédiée en C++/Java
- le moteur d'extraction où là tu peux utiliser du PHP
Vu tes questions, à mon avis clairement tu vises trop compliqué pour commencer.
Démarre par le moteur d'extraction avec les outils qui t'ont été indiqué précédemment. Une fois que tu maitriseras cette partie, tu pourras t'attaquer au front.
Re: simple html dom
Posté : 22 janv. 2016, 13:43
par azizss
Merci,
Je comprend pour commencer il faudrait que je maitrise le "SIMPLE DOM PHP" dans les exemple donnée avant j'ai utiliser tous les extractions.
Mais je comprend pas le principe, peux-tu m'aider avec un exemple concret.
Merci a toi,
Re: simple html dom
Posté : 22 janv. 2016, 16:21
par @rthur
Le principe est pourtant simple... une page HTML est composée de balises qui composent ce que l'on appelle un arbre DOM.
Un arbre DOM est composé de noeuds (= les balises HTML). Une explication est dispo ici :
http://www.quirksmode.org/dom/intro.html
Maintenant, à toi de faire un effort :
Regarde les scripts proposés précédemment et commence à les tester et à te faire la main dessus.
Quasiment à chaque fois dans leur doc il y a des exemples concrets de comment les utiliser.
Re: simple html dom
Posté : 22 janv. 2016, 16:54
par azizss
Super,
Merci à toi @rthur,
j'ai commencer et cela aller de fonctionner dans le bon sens.
Merci a toi,