Il suit les liens, il choppe les url, les charge et voilà, tu pourrais bien faire un robot en PHP avec les fonctions pour récupérer du contenu.Comment (concrètement) un robot parvient-il à parcourir toutes les pages d'un site?
Dans une base de données par exemple, comme n'importe quel script peut le faireComment enregistre-t-il ses données?
Bien sûr que non (sauf faille), un robot ça reste un programme informatique, ce n'est pas Dieu et il n'a pas plus de droits que n'importe quiPeut-il accéder aux parties protégées d'un site par login/mot de passe (espace utilisateurs ou administration par exemple) ou par .htaccess?
Bizarre comme question, une page protégée c'est une page protégée, tu n'y accèdes pas et tu ne récupères pas son code sourceScanne-t-il le code source envoyé à un navigateur directement? (dans ce cas il peut scanner des pages protégées alors?)
A priori, les profs sont des personnes de confiance. Je ne pense pas que ce soient eux qui chercheraient à faire foirer ce site, mais je pense plutôt aux élèves...re bonjour
Effectivement, toute les pages de ton site qui sont protégées par un système d'identification sont de ce fait inaccessibles par les robots.
Après, le seul maillon faible sont les utilisateurs autorisés à visiter ces pages. Rien n'empêche l'un d'entre eux de récupérer les mail et de les rendre public pour des mail list.
Pour éviter ça, une seule solution : un formulaire d'envoi de mail. Ou alors tu estimes que tu peux faire une totale confiance à tes visiteurs autorisés.
Juste pour préciser, que ce n'est parcequ'une personne est une personne de confiance, qu'elle ne peut pas faire d'erreur....A priori, les profs sont des personnes de confiance. Je ne pense pas que ce soient eux qui chercheraient à faire foirer ce site, mais je pense plutôt aux élèves...
Sans même parler de vouloir foirer ton site... une petite rancoeur personnelle et l'on fait une "petite blague avec le mail du voisin" etc.
A priori, les profs sont des personnes de confiance. Je ne pense pas que ce soient eux qui chercheraient à faire foirer ce site, mais je pense plutôt aux élèves...
ca m'intéresse aussi, merci d'avanceAutre question: peut-on détecter la présence d'un robot sur son site? Si oui, comment?
ca m'intéresse aussi, merci d'avanceAutre question: peut-on détecter la présence d'un robot sur son site? Si oui, comment?
Cela dépend s'ils cherchent à se cacher ou pas...Si oui ils peuvent adopter une entête ou un IP courant indétectable :Un fournisseur de fofos gratuits que j'ai utilisé il y a un certain temps pouvait afficher dans la liste des utilisateurs connecté le nom des bots.
Vous êtes sur qu'ils ne se trahissent pas par des variables de $_SERVER?
Effectivement faut pas compter sur un pirate pour respecter le manuel de bonne conduite!http://fr.selfhtml.org/divers/robots.htm
ça peut aider pour les moteurs de recherche "basiques" à la google-bot.
Par contre aucune idée de si des robots de pirates respectent ces indications, entre nous ça m'étonnerait..
![]()
![]()
Pour les anglophones, il me semble que faire une recherche sur "spider" et "crawler" devrait vous donner plus d'infos