par
alsab » 01 mars 2011, 17:08
Salut,
Je suis à la recherche de conseil dans le choix du matériel pour un webcrawler.
Voilà je suis entrain de créer un site comparateur de prix dans un secteur particulier, pour récupérer les données des produits qui seront dans le comparateur, j'ai créer un script php qui visite chaque page de certain sites(avec leur autorisation), dans lesquelles je récupère les informations(nom, description,image, poid, h, l, p ...), et je stocke ces données dans Mysql.
Pour chaque site je devrais visité environ 20.000 pages, et je devrais avoir à terme environ 50 sites a visités, soit environ 1.000.000 pages.
Je pense faire 2 passages chaque jour pour vérifier les quantités disponibles, soit 2.000.000 pages/jour.
Donc si quelqu'un peut me donner quelques conseils, merci d'avance.
Salut,
Je suis à la recherche de conseil dans le choix du matériel pour un webcrawler.
Voilà je suis entrain de créer un site comparateur de prix dans un secteur particulier, pour récupérer les données des produits qui seront dans le comparateur, j'ai créer un script php qui visite chaque page de certain sites(avec leur autorisation), dans lesquelles je récupère les informations(nom, description,image, poid, h, l, p ...), et je stocke ces données dans Mysql.
Pour chaque site je devrais visité environ 20.000 pages, et je devrais avoir à terme environ 50 sites a visités, soit environ 1.000.000 pages.
Je pense faire 2 passages chaque jour pour vérifier les quantités disponibles, soit 2.000.000 pages/jour.
Donc si quelqu'un peut me donner quelques conseils, merci d'avance.