Analyse de page web

02 févr. 2010, 16:52

Bonjour,

Voilà quelques semaines que je me suis mis à suivre la bourse. Et très rapidement le choc informaticien/bourse à fait resortir quelques idées.
La bourse c'est une succession d'actions qui montent et qui descendent. Je passe mes journées à naviguer de site en site, d'actions en actions pour les suivre. Je suis de près quelques actions mais j'aimerais en suivre un peu plus.

J'aimerais pouvoir faire un script qui
*se connecte sur une page définie (ex : http://www.boursorama.com/cours.phtml?symbole=1rPALU)
*extrait le source de la page
*recherche la chaine '<div class="InfB"><span class="gras">' et lit la chaine numérique suivante
*compare la valeur avec ma BDD
*envoi un mail si valeur > seuil dans bdd

C'est les 2 premiers points que je ne maitrise pas. Auriez-vous une piste en PHP? Auriez-vous un autre langage à me conseiller? C#?

Merci pour vos réponses.

02 févr. 2010, 16:54

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.

02 févr. 2010, 17:12

A mon avis ton problème le plus difficile est la connexion à la page et l'extraction du source non?

02 févr. 2010, 17:20

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.

Rien qu'avec ça, c'est faisable.

02 févr. 2010, 17:43

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.

Ah non pitié, pour parser du html DomDocument est la.

02 févr. 2010, 19:52

Ah non pitié, pour parser du html DomDocument est la.

Encore faut-il que le document soit correctement formé, un paramètre qu'on ne peut maîtriser dans ce cas précis…

02 févr. 2010, 20:42

Ah non pitié, pour parser du html DomDocument est la.
Encore faut-il que le document soit correctement formé, un paramètre qu'on ne peut maîtriser dans ce cas précis…

c'est faux et c'est une fausse excuse, domdocument est prevu pour ca grâce a a la libxml. Un document même mal former peu avoir l'affiche que le souhaite sous le navigateur, ici c'est pareil. Je le repetes les regexp ne font pas faites pour parser du html.

Analyse de page web

Qui est en ligne