Repérer et récupérer des données dynamiques sur un autre site

Répondre


Cette question est un moyen d’empêcher des soumissions automatisées de formulaires par des robots.
Smileys
:D :) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: =D> #-o =P~ :^o :non: :priere: 8-|
Voir plus de smileys
  Revue du sujet
 

  Étendre la vue Revue du sujet : Repérer et récupérer des données dynamiques sur un autre site

par choubix » 22 nov. 2007, 19:03

j'ai trouve ca dans un autre topic qui pourrait peut etre t'etre utile:

http://www.phpfrance.com/forums/voir_sujet-34175.php

par h0_noMan » 22 nov. 2007, 11:20

Dois tu te connecter avec ton compte avant d'avoir acces aux emails ?

par sadeq » 22 nov. 2007, 04:03

si le paramètre de configuration dans php.ini allow_url_fopen = On alors ton serveur peut lire des url comme un fichier texte. Dans ce cas tu peux utiliser la fonction fopen() pour récurérer les pages.
Une fois une page lue, tu peux utiliser une expression régulière pour extraire l'adresse email qui se trouve dans la forme que tu as présentée. Regardre au niveau de la fonction preg_match() pour ça.

Repérer et récupérer des données dynamiques sur un autre sit

par Jabric » 22 nov. 2007, 00:13

Bonjour à tous.

J'utilise à mes heures perdues un site de networking (Viade0 pour ne pas le nommer) qui permet d'ajouter des contacts à son profil.
Je souhaiterais récupérer les emails de chacun de ces contacts, mais la fonction d'export n'est pas proposée sur le site. Je n'en ai pas tant que cela et pourrait rapidement le faire à la main, mais je me suis dit que cela pourrait être l'occasion de faire un peu de code.
Sauf qu'en l'occurrence je ne sais pas par où commencer, quelles infos chercher.

Voilà comment cela fonctionne :
Les profils sont listés sous forme de pages.
Les pages sont du type http://www.viade0.com/contacts/contacts ... geNumber=1#
Il y a 15 contacts par page.
Pour chaque contact, l'email est présenté sous la forme suivante : <div class="memberMail">E-mail :&nbsp;<a class="main" href="mailto:xxxxx@xxxxx" title="">xxxxx@xxxxx</a> </div>

Dans l'idée, j'imagine qu'il faut récupérer l'url de la page, puis la parcourir pour récupérer tous les contenus de mailto qui répondent à des contraintes spécifiques, puis passer à la page suivante, tant qu'il y en a une.
--> Est-ce compliqué ?
--> Pourriez-vous m'aiguiller vers des tutoriaux / aides qui traitent de ce sujet ?

merci d'avance pour votre aide !
Jérémie.