Marre du spam - Vengez-vous !
Posté : 03 mars 2006, 12:24
Si, comme tout le monde, vous souffrez du raz de marée des spam dans votre boîte courriel VENGEZ-VOUS !
- Le contexte:
Les robots qui moissonnent les adresses email (address harvesting web crawlers) sont, le plus souvent, assez stupides pour suivre tout lien de vos pages pour y capturer les adresses email. C'est leur point faible. - La solution gentille:
Mettre dans quelques pages-clé de votre site un lien caché qui pointe vers un trou noir où ils s'engloutiront en s'épuisant à suivre d'autres liens bidons (les anglophones ont un vocabulaire très imagé pour décrire la technique: honey pot - sand trap - blackole ...)
Bien entendu, ces pages bidons seront générées dynamiquement avec votre langage de script favori. Rien de très compliqué. - La solution vengeresse:
Rajouter dans ces pages dynamiques bidons des adresses email tout aussi bidons qui pollueront les banques d'adresses des pirates, ce qui les rendra, à long terme, virtuellement inutilisables. - Exemple de page bidon:
http://www.monkeys.com/spammers-are-leeches/Malthusian - Précautions:
- ne pas piéger les robots légitimes!
Le but n'étant pas de piéger les bots google et autres robots légitimes, il est impératif (par respect pour ces robots utiles) de leur indiquer de passer leur chemin. Par tag ou, mieux, par le protocole d'exclusion des robots.
Impératif pour ne pas être accusé de faire du "cloaking" et de finir dans le bac-à-sable de Google (une sorte de quarantaine du réferencement). - Ne pas surcharger le trafic de votre site
Soit vous temporisez l'affichage de vos pages dynamiques par un sleep(5) par exemple, soit vous limitez la "profondeur" de votre trou noir en capturant l'IP du robot et en lui donnant "droit" à x pages bidons.
- ne pas piéger les robots légitimes!
- Sources:
http://linux.oldcrank.com/tips/antibot/
http://www.monkeys.com/wpoison/