Administrateur PHPfrance |
3131 Messages
13 nov. 2006, 13:10
Si je devais faire un script de détection des adresses dans une pages, ce serait une expression de ce style :
#([a-zA-Z0-9_\-]){3,}.{0,5}*(?:at|@|a).{0,5}*(?:\.|dot|point).{0,5}*([a-zA-Z0-9_\-]){2,}# non testée, probablement buggée, mais vous voyez l'esprit. Tant qu'on "camoufle" en jouant sur les séparateurs je pense que ça ne vaut que très moyennement (les robots "basiques").
La seule méthode vraiment efficace est celle basée sur Javascript : ça se décode très bien, mais c'est bien plus coûteux en terme de ressources (temps, surtout) et un robot ramasseur de mails, son principal intérêt c'est d'être rapide pour amener une bibliothèque énorme de mails le plus vite possible.
Jusqu'au jour où...
Donc +1 pour cyrano : du moment où une adresse e-mail est affichée de quelque manière que ce soit, elle est vulnérable. Personnellement je remplacerais les emails par des images pour être vraiment peinard
D'ailleurs, un site web proposant un service simple de ce genre pourrait être sympa :
- on choisit un texte, une police, une couleur de texte, une couleur de fond.
- il génère une image présentant ce texte (et rien d'autre) disponible à une adresse "à la tinyurl".
Et voilà comment mettre son adresse mail dans les forums sans craindre le spam (pas besoin non plus d'aller captcha-iser l'image, les robots-spammeurs-OCR ne sont pas encore près d'arriver il faut être réaliste quand-même).