Analyse de page web

dkrte
Invité n'ayant pas de compte PHPfrance

02 févr. 2010, 16:52

Bonjour,

Voilà quelques semaines que je me suis mis à suivre la bourse. Et très rapidement le choc informaticien/bourse à fait resortir quelques idées.
La bourse c'est une succession d'actions qui montent et qui descendent. Je passe mes journées à naviguer de site en site, d'actions en actions pour les suivre. Je suis de près quelques actions mais j'aimerais en suivre un peu plus.

J'aimerais pouvoir faire un script qui
*se connecte sur une page définie (ex : http://www.boursorama.com/cours.phtml?symbole=1rPALU)
*extrait le source de la page
*recherche la chaine '<div class="InfB"><span class="gras">' et lit la chaine numérique suivante
*compare la valeur avec ma BDD
*envoi un mail si valeur > seuil dans bdd

C'est les 2 premiers points que je ne maitrise pas. Auriez-vous une piste en PHP? Auriez-vous un autre langage à me conseiller? C#?

Merci pour vos réponses.

Mammouth du PHP | 2937 Messages

02 févr. 2010, 16:54

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.

Eléphant du PHP | 168 Messages

02 févr. 2010, 17:12

A mon avis ton problème le plus difficile est la connexion à la page et l'extraction du source non?

Mammouth du PHP | 568 Messages

02 févr. 2010, 17:20

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.
Rien qu'avec ça, c'est faisable.

ViPHP
ViPHP | 5462 Messages

02 févr. 2010, 17:43

La fonction file_get_contents () et un preg_match () peuvent constituer une piste à explorer.
Ah non pitié, pour parser du html DomDocument est la.

Mammouth du PHP | 2937 Messages

02 févr. 2010, 19:52

Ah non pitié, pour parser du html DomDocument est la.
Encore faut-il que le document soit correctement formé, un paramètre qu'on ne peut maîtriser dans ce cas précis… :-k

ViPHP
ViPHP | 5462 Messages

02 févr. 2010, 20:42

Ah non pitié, pour parser du html DomDocument est la.
Encore faut-il que le document soit correctement formé, un paramètre qu'on ne peut maîtriser dans ce cas précis… :-k
c'est faux et c'est une fausse excuse, domdocument est prevu pour ca grâce a a la libxml. Un document même mal former peu avoir l'affiche que le souhaite sous le navigateur, ici c'est pareil. Je le repetes les regexp ne font pas faites pour parser du html.