Page 1 sur 1

Référencement : robots.txt

Posté : 10 nov. 2006, 02:24
par albat
Bonsoir,

Pour laisser l'accès complet à un site à tous les robots qui peuvent passer,
3 solutions sont indiquées comme équivalentes :
  • pas de fichier robots.txt
  • un fichier robots.txt vide
  • un fichier robots.txt contenant :

    Code : Tout sélectionner

    User-Agent: * Disallow:
Je commence à me demander si ces 3 méthodes sont strictement identiques...

Actuellement, je n'ai placé aucun fichier robots.txt.
Je reçois chaque jour en moyenne 3 à 4 visites de robots.
Grâce à leurs IP, j'ai pu en identifier certains.
Comment se fait-il que certains robots reviennent plusieurs fois par jour ?
Si je leur donnais un fichier robots.txt à manger, cela les calmerait-il ?

Posté : 10 nov. 2006, 09:20
par Cyrano
Il existe une quatrième option : une balise meta, par exemple :

Code : Tout sélectionner

<meta name="Robots" content="all" />
À laquelle tu peux adjoindre une autre balise meta :

Code : Tout sélectionner

<meta name="revisit-after" content="15 days" />
En théorie, ça devrait faire que les robots suivront et indexeront la page et suivront les liens de cette page puis reviendront 15 jours plus tard pour mettre à jour l'indexation.

Un petit article très clair sur le fichier robots.txt décrit assez bien les possibilités.

Posté : 11 nov. 2006, 02:33
par Ultim4T0m
Bonsoir,

J'en profite pour poser une question :

Y'a t-il un moyen pour permettre aux robots de parcourir des pages d'un espace membre, contenant donc une redirection si aucune session utilisateur n'existe.

Je vois mal comment un robot pourrait faire, mais on ne sait jamais...^^'

En espérant avoir été suffisamment clair.

Merci.

Posté : 11 nov. 2006, 08:50
par Cyrano
Non, dans la mesure ou un robot sera comme un internaute et devra s'identifier pour acceder à un espace membre, or meme en admettant qu'il puisse s'inscrire, il ne pourrait acceder qu'a son propre espace ou a la partie commune des membres inscrits et identifies.