Robot.txt, tout une histoire.
Posté : 02 avr. 2008, 17:51
Sur le blog de Karl Dubost, on trouve beaucoup d'articles qui nous emmène loin de notre petit espace. Beaucoup de poésie, de très belles photos ; en bref, du calme.
Mais on trouve également des articles fort intéressant, comme ce dernier : Robots bien bavards. Il y fait un lien vers son précédent article sur les robots (également très intéressant).
On y apprend que eBay à un dossier disney/ à protéger. Microsoft bloque des fichiers bien particulier, allez savoir pourquoi ... Plus malin : la NSA se sert du fichier robots.txt pour éviter les débordements de bande passante.
Une question me vient à l'esprit soudainement. Et si on ajoutait un <meta /> dans les pages HTML pour remplacer les robots.txt ? Il est vrai que les robots.txt ne sont pas très bons (tant niveau architecture que syntaxe).
Mais on trouve également des articles fort intéressant, comme ce dernier : Robots bien bavards. Il y fait un lien vers son précédent article sur les robots (également très intéressant).
On y apprend que eBay à un dossier disney/ à protéger. Microsoft bloque des fichiers bien particulier, allez savoir pourquoi ... Plus malin : la NSA se sert du fichier robots.txt pour éviter les débordements de bande passante.
Une question me vient à l'esprit soudainement. Et si on ajoutait un <meta /> dans les pages HTML pour remplacer les robots.txt ? Il est vrai que les robots.txt ne sont pas très bons (tant niveau architecture que syntaxe).