Analyse de page web

Répondre


Cette question est un moyen d’empêcher des soumissions automatisées de formulaires par des robots.
Smileys
:D :) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen: =D> #-o =P~ :^o :non: :priere: 8-|
Voir plus de smileys
  Revue du sujet
 

  Étendre la vue Revue du sujet : Analyse de page web

Re: Analyse de page web

par stealth35 » 02 févr. 2010, 20:42

Ah non pitié, pour parser du html DomDocument est la.
Encore faut-il que le document soit correctement formé, un paramètre qu'on ne peut maîtriser dans ce cas précis… :-k
c'est faux et c'est une fausse excuse, domdocument est prevu pour ca grâce a a la libxml. Un document même mal former peu avoir l'affiche que le souhaite sous le navigateur, ici c'est pareil. Je le repetes les regexp ne font pas faites pour parser du html.

Re: Analyse de page web

par Victor BRITO » 02 févr. 2010, 19:52

Ah non pitié, pour parser du html DomDocument est la.
Encore faut-il que le document soit correctement formé, un paramètre qu'on ne peut maîtriser dans ce cas précis… :-k

Re: Analyse de page web

par stealth35 » 02 févr. 2010, 17:43

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.
Ah non pitié, pour parser du html DomDocument est la.

Re: Analyse de page web

par Yosh » 02 févr. 2010, 17:20

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.
Rien qu'avec ça, c'est faisable.

Re: Analyse de page web

par jojo1000 » 02 févr. 2010, 17:12

A mon avis ton problème le plus difficile est la connexion à la page et l'extraction du source non?

Re: Analyse de page web

par Victor BRITO » 02 févr. 2010, 16:54

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.

Analyse de page web

par dkrte » 02 févr. 2010, 16:52

Bonjour,

Voilà quelques semaines que je me suis mis à suivre la bourse. Et très rapidement le choc informaticien/bourse à fait resortir quelques idées.
La bourse c'est une succession d'actions qui montent et qui descendent. Je passe mes journées à naviguer de site en site, d'actions en actions pour les suivre. Je suis de près quelques actions mais j'aimerais en suivre un peu plus.

J'aimerais pouvoir faire un script qui
*se connecte sur une page définie (ex : http://www.boursorama.com/cours.phtml?symbole=1rPALU)
*extrait le source de la page
*recherche la chaine '<div class="InfB"><span class="gras">' et lit la chaine numérique suivante
*compare la valeur avec ma BDD
*envoi un mail si valeur > seuil dans bdd

C'est les 2 premiers points que je ne maitrise pas. Auriez-vous une piste en PHP? Auriez-vous un autre langage à me conseiller? C#?

Merci pour vos réponses.