Page 1 sur 1

Mon site redirige vers google

Posté : 12 mai 2009, 20:06
par bunk
Bonsoir,

Je ne sais pas si je suis dans la bonne partie du forum mais je n'en voyais pas une plus appropriée.

Au début du mois j'ai ouvert un nouveau site hébergé chez OneAndOne (pas de commentaires sur l'hébergeur c'est pas le sujet), je me bat depuis pour le faire référencé.

J'ai reçu plusieurs mail de visiteurs m'informant que mon site (enfin l'URL que j'ai communiqué) les renvoyé sur google !

J'ai fait quelques recherche via google justement et je suis tombé sur ce site : spider-simulator qui permettrait de voir ce que voit le robot de google par exemple. Lorsque je rentre mon URL en premier lieu il m'indique :

Code : Tout sélectionner

* URL: http://www.google.fr/ * Type: text/html; charset=ISO-8859-1 * HTTP code: 200 * Temps de traitement : 1 s * URL size: 5 kB
mais ce n'est pas mon URL !!!
Il me donne bien mes meta après.

Je ne comprend pas du tout mon erreur.
En revanche chez moi et d'autre personne il n'y à pas de problème.

Par contre mon site à disparu de google.

Pouvez-vous m'aider dans mon investigation ?

D'avance merci.

--------
J'ai trouvé !

J'avais utilisé un .htaccess d'un autre site et qui contenait ceci :

Code : Tout sélectionner

####################################################################################### # Anti Aspirateur (http://google.fr) # ####################################################################################### RewriteCond %{HTTP_USER_AGENT} .*almaden* [OR] RewriteCond %{HTTP_USER_AGENT} .*attach* [OR] RewriteCond %{HTTP_USER_AGENT} .*autoemailspider* [OR] RewriteCond %{HTTP_USER_AGENT} .*ASPSeek* [OR] RewriteCond %{HTTP_USER_AGENT} .*Anarchie* [OR] RewriteCond %{HTTP_USER_AGENT} .*BackWeb* [OR] RewriteCond %{HTTP_USER_AGENT} .*Bandit* [OR] RewriteCond %{HTTP_USER_AGENT} .*BatchFTP* [OR] RewriteCond %{HTTP_USER_AGENT} .*BlackWidow* [OR] RewriteCond %{HTTP_USER_AGENT} .*bmclient* [OR] RewriteCond %{HTTP_USER_AGENT} .*Bot\ mailto:[email protected]* [OR] RewriteCond %{HTTP_USER_AGENT} .*Bot\mailto:[email protected]* [OR] RewriteCond %{HTTP_USER_AGENT} .*Buddy* [OR] RewriteCond %{HTTP_USER_AGENT} .*bumblebee* [OR] RewriteCond %{HTTP_USER_AGENT} .*Bullseye* [OR] RewriteCond %{HTTP_USER_AGENT} .*CICC* [OR] RewriteCond %{HTTP_USER_AGENT} .*capture* [OR] RewriteCond %{HTTP_USER_AGENT} .*clipping* [OR] RewriteCond %{HTTP_USER_AGENT} .*CherryPicker* [OR] RewriteCond %{HTTP_USER_AGENT} .*CherryPickerSE* [OR] RewriteCond %{HTTP_USER_AGENT} .*CherryPickerElite* [OR] RewriteCond %{HTTP_USER_AGENT} .*ChinaClaw* [OR] RewriteCond %{HTTP_USER_AGENT} .*Collector* [OR] RewriteCond %{HTTP_USER_AGENT} .*collage* [OR] RewriteCond %{HTTP_USER_AGENT} .*copier* [OR] RewriteCond %{HTTP_USER_AGENT} .*Crescent* [OR] RewriteCond %{HTTP_USER_AGENT} .*Crescent.*Internet.*ToolPak.* [OR] RewriteCond %{HTTP_USER_AGENT} .*DA* [OR] RewriteCond %{HTTP_USER_AGENT} .*DIIbot* [OR] RewriteCond %{HTTP_USER_AGENT} .*deepindexer* [OR] RewriteCond %{HTTP_USER_AGENT} .*diagem* [OR] RewriteCond %{HTTP_USER_AGENT} .*DISCo* [OR] RewriteCond %{HTTP_USER_AGENT} .*DISCo\Pump* [OR] RewriteCond %{HTTP_USER_AGENT} .*Download\ Demon* [OR] RewriteCond %{HTTP_USER_AGENT} .*Download\Demon* [OR] RewriteCond %{HTTP_USER_AGENT} .*Download\Wonder* [OR] RewriteCond %{HTTP_USER_AGENT} .*Downloader* [OR] RewriteCond %{HTTP_USER_AGENT} .*Drip* [OR] RewriteCond %{HTTP_USER_AGENT} .*DSurf15a* [OR] RewriteCond %{HTTP_USER_AGENT} .*dual*proxy* [OR] RewriteCond %{HTTP_USER_AGENT} .*eCatch* [OR] RewriteCond %{HTTP_USER_AGENT} .*EirGrabber* [OR] RewriteCond %{HTTP_USER_AGENT} .*email* [OR] RewriteCond %{HTTP_USER_AGENT} .*EmailCollector* [OR] RewriteCond %{HTTP_USER_AGENT} .*EmailSiphon* [OR] RewriteCond %{HTTP_USER_AGENT} .*EmailWolf* [OR] RewriteCond %{HTTP_USER_AGENT} .*EasyDL/2.99* [OR] RewriteCond %{HTTP_USER_AGENT} .*easydl* [OR] RewriteCond %{HTTP_USER_AGENT} .*Express\ WebPictures* [OR] RewriteCond %{HTTP_USER_AGENT} .*Express\WebPictures* [OR] RewriteCond %{HTTP_USER_AGENT} .*ExtractorPro* [OR] RewriteCond %{HTTP_USER_AGENT} .*EyeNetIE* [OR] RewriteCond %{HTTP_USER_AGENT} .*FlashGet* [OR] RewriteCond %{HTTP_USER_AGENT} .*fastlwspider/1.0.* [OR] RewriteCond %{HTTP_USER_AGENT} .*fetch* [OR] RewriteCond %{HTTP_USER_AGENT} .*FileHound* [OR] RewriteCond %{HTTP_USER_AGENT} .*frontpage* [OR] RewriteCond %{HTTP_USER_AGENT} .*GetRight* [OR] RewriteCond %{HTTP_USER_AGENT} .*GetSmart* [OR] RewriteCond %{HTTP_USER_AGENT} .*GetWebPage.* [OR] RewriteCond %{HTTP_USER_AGENT} .*gigabaz* [OR] RewriteCond %{HTTP_USER_AGENT} .*Go-Ahead-Got-It* [OR] RewriteCond %{HTTP_USER_AGENT} .*Go!Zilla* [OR] RewriteCond %{HTTP_USER_AGENT} .*gotit* [OR] RewriteCond %{HTTP_USER_AGENT} .*Grabber* [OR] RewriteCond %{HTTP_USER_AGENT} .*GrabNet* [OR] RewriteCond %{HTTP_USER_AGENT} .*Grafula* [OR] RewriteCond %{HTTP_USER_AGENT} .*grub-client* [OR] RewriteCond %{HTTP_USER_AGENT} .*grub* [OR] RewriteCond %{HTTP_USER_AGENT} .*hloader* [OR] RewriteCond %{HTTP_USER_AGENT} .*HMView* [OR] RewriteCond %{HTTP_USER_AGENT} .*html* [OR] RewriteCond %{HTTP_USER_AGENT} .*http* [OR] RewriteCond %{HTTP_USER_AGENT} .*HTTrack* [OR] RewriteCond %{HTTP_USER_AGENT} .*httpdown* [OR] RewriteCond %{HTTP_USER_AGENT} .*HTTPConnect* [OR] RewriteCond %{HTTP_USER_AGENT} .*ia_archive* [OR] RewriteCond %{HTTP_USER_AGENT} .*ia_archiver* [OR] RewriteCond %{HTTP_USER_AGENT} .*Image\ Stripper* [OR] RewriteCond %{HTTP_USER_AGENT} .*Image\ Sucker* [OR] RewriteCond %{HTTP_USER_AGENT} .*Indy*Library* [OR] RewriteCond %{HTTP_USER_AGENT} .*informant* [OR] RewriteCond %{HTTP_USER_AGENT} .*InternetLinkAgent* [OR] RewriteCond %{HTTP_USER_AGENT} .*InterGET* [OR] RewriteCond %{HTTP_USER_AGENT} .*Internet\ Ninja* [OR] RewriteCond %{HTTP_USER_AGENT} .*Internet\Ninja* [OR] RewriteCond %{HTTP_USER_AGENT} .*InternetSeer.com* [OR] RewriteCond %{HTTP_USER_AGENT} .*inktomi* [OR] RewriteCond %{HTTP_USER_AGENT} .*Iria* [OR] RewriteCond %{HTTP_USER_AGENT} .*JBH*Agent* [OR] RewriteCond %{HTTP_USER_AGENT} .*JetCar* [OR] RewriteCond %{HTTP_USER_AGENT} .*JOC* [OR] RewriteCond %{HTTP_USER_AGENT} .*JOC\ Web\ Spider* [OR] RewriteCond %{HTTP_USER_AGENT} .*JustView* [OR] RewriteCond %{HTTP_USER_AGENT} .*larbin* [OR] RewriteCond %{HTTP_USER_AGENT} .*LeechFTP* [OR] RewriteCond %{HTTP_USER_AGENT} .*LexiBot* [OR] RewriteCond %{HTTP_USER_AGENT} .*lftp* [OR] RewriteCond %{HTTP_USER_AGENT} .*likse* [OR] RewriteCond %{HTTP_USER_AGENT} .*LinkWalker* [OR] RewriteCond %{HTTP_USER_AGENT} .*Link*Sleuth* [OR] RewriteCond %{HTTP_USER_AGENT} .*Link* [OR] RewriteCond %{HTTP_USER_AGENT} .*lotus* [OR] RewriteCond %{HTTP_USER_AGENT} .*lwp-trivial.* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mag-Net* [OR] RewriteCond %{HTTP_USER_AGENT} .*Magnet* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mass\ Downloader* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mass\Downloader* [OR] RewriteCond %{HTTP_USER_AGENT} .*Memo* [OR] RewriteCond %{HTTP_USER_AGENT} .*MIDown\ tool* [OR] RewriteCond %{HTTP_USER_AGENT} .*MIDown\tool* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mirror* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mister\ PiX* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mister\PiX* [OR] RewriteCond %{HTTP_USER_AGENT} .*Microsoft.URL* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mozilla.*NEWT* [OR] RewriteCond %{HTTP_USER_AGENT} .*Mozilla*MSIECrawler* [OR] RewriteCond %{HTTP_USER_AGENT} .*MSFrontPage* [OR] RewriteCond %{HTTP_USER_AGENT} .*MSIECrawler* [OR] RewriteCond %{HTTP_USER_AGENT} .*MSProxy* [OR] RewriteCond %{HTTP_USER_AGENT} .*multithreaddb* [OR] RewriteCond %{HTTP_USER_AGENT} .*nationaldirectory* [OR] RewriteCond %{HTTP_USER_AGENT} .*Navroad* [OR] RewriteCond %{HTTP_USER_AGENT} .*NearSite* [OR] RewriteCond %{HTTP_USER_AGENT} .*NetMechanic* [OR] RewriteCond %{HTTP_USER_AGENT} .*Net\ Vampire* [OR] RewriteCond %{HTTP_USER_AGENT} .*Net\Vampire* [OR] RewriteCond %{HTTP_USER_AGENT} .*NetAnts* [OR] RewriteCond %{HTTP_USER_AGENT} .*NetSpider* [OR] RewriteCond %{HTTP_USER_AGENT} .*NetZIP* [OR] RewriteCond %{HTTP_USER_AGENT} .*NICErsPRO* [OR] RewriteCond %{HTTP_USER_AGENT} .*Ninja* [OR] RewriteCond %{HTTP_USER_AGENT} .*obot* [OR] RewriteCond %{HTTP_USER_AGENT} .*Octopus* [OR] RewriteCond %{HTTP_USER_AGENT} .*Offline\ Explorer* [OR] RewriteCond %{HTTP_USER_AGENT} .*Offline\ Navigator* [OR] RewriteCond %{HTTP_USER_AGENT} .*Offline\Explorer* [OR] RewriteCond %{HTTP_USER_AGENT} .*Offline\Navigator* [OR] RewriteCond %{HTTP_USER_AGENT} .*Offline* [OR] RewriteCond %{HTTP_USER_AGENT} .*Openfind* [OR] RewriteCond %{HTTP_USER_AGENT} .*PageGrabber* [OR] RewriteCond %{HTTP_USER_AGENT} .*Papa\ Foto* [OR] RewriteCond %{HTTP_USER_AGENT} .*Papa\Foto* [OR] RewriteCond %{HTTP_USER_AGENT} .*pcBrowser* [OR] RewriteCond %{HTTP_USER_AGENT} .*Ping* [OR] RewriteCond %{HTTP_USER_AGENT} .*PingALink* [OR] RewriteCond %{HTTP_USER_AGENT} .*Pockey* [OR] RewriteCond %{HTTP_USER_AGENT} .*Proxy* [OR] RewriteCond %{HTTP_USER_AGENT} .*psbot* [OR] RewriteCond %{HTTP_USER_AGENT} .*Pump* [OR] RewriteCond %[HTTP_USER_AGENT} .*QRVA* [OR] RewriteCond %{HTTP_USER_AGENT} .*RealDownload* [OR] RewriteCond %{HTTP_USER_AGENT} .*Reaper* [OR] RewriteCond %{HTTP_USER_AGENT} .*Recorder* [OR] RewriteCond %{HTTP_USER_AGENT} .*ReGet* [OR] RewriteCond %{HTTP_USER_AGENT} .*replacer* [OR] RewriteCond %{HTTP_USER_AGENT} .*Scooter* [OR] RewriteCond %{HTTP_USER_AGENT} .*Seeker* [OR] RewriteCond %{HTTP_USER_AGENT} .*Siphon* [OR] RewriteCond %{HTTP_USER_AGENT} .*sitecheck.internetseer.com* [OR] RewriteCond %{HTTP_USER_AGENT} .*site* [OR] RewriteCond %{HTTP_USER_AGENT} .*SiteSnagger* [OR] RewriteCond %{HTTP_USER_AGENT} .*SlySearch* [OR] RewriteCond %{HTTP_USER_AGENT} .*Slurp* [OR] RewriteCond %{HTTP_USER_AGENT} .*slurp* [OR] RewriteCond %{HTTP_USER_AGENT} .*SmartDownload* [OR] RewriteCond %{HTTP_USER_AGENT} .*Snake* [OR] RewriteCond %{HTTP_USER_AGENT} .*SpaceBison* [OR] RewriteCond %{HTTP_USER_AGENT} .*Stripper* [OR] RewriteCond %{HTTP_USER_AGENT} .*Strip* [OR] RewriteCond %{HTTP_USER_AGENT} .*Sucker* [OR] RewriteCond %{HTTP_USER_AGENT} .*SurfWalker.* [OR] RewriteCond %{HTTP_USER_AGENT} .*SuperBot* [OR] RewriteCond %{HTTP_USER_AGENT} .*SuperHTTP* [OR] RewriteCond %{HTTP_USER_AGENT} .*surfcontrol* [OR] RewriteCond %{HTTP_USER_AGENT} .*Surfbot* [OR] RewriteCond %{HTTP_USER_AGENT} .*Surf* [OR] RewriteCond %{HTTP_USER_AGENT} .*Szukacz* [OR] RewriteCond %{HTTP_USER_AGENT} .*tAkeOut* [OR] RewriteCond %{HTTP_USER_AGENT} .*Teleport* [OR] RewriteCond %{HTTP_USER_AGENT} .*Teleport\ Pro* [OR] RewriteCond %{HTTP_USER_AGENT} .*Telesoft* [OR] RewriteCond %{HTTP_USER_AGENT} .*TV33_Mercator* [OR] RewriteCond %{HTTP_USER_AGENT} .*turingos* [OR] RewriteCond %{HTTP_USER_AGENT} .*URLSpiderPro* [OR] RewriteCond %{HTTP_USER_AGENT} .*Vacuum* [OR] RewriteCond %{HTTP_USER_AGENT} .*vagabondo* [OR] RewriteCond %{HTTP_USER_AGENT} .*visibilitygap* [OR] RewriteCond %{HTTP_USER_AGENT} .*VoidEYE* [OR] RewriteCond %{HTTP_USER_AGENT} .*Whacker* [OR] RewriteCond %{HTTP_USER_AGENT} .*watcher* [OR] RewriteCond %{HTTP_USER_AGENT} .*[Ww]eb[Bb]andit* [OR] RewriteCond %{HTTP_USER_AGENT} .*Wweb* [OR] RewriteCond %{HTTP_USER_AGENT} .*Web\ Image\ Collector* [OR] RewriteCond %{HTTP_USER_AGENT} .*Web\Image\Collector* [OR] RewriteCond %{HTTP_USER_AGENT} .*Web\ Sucker* [OR] RewriteCond %{HTTP_USER_AGENT} .*Web\Sucker* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebAuto* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebCopier* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebCapture* [OR] RewriteCond %{HTTP_USER_AGENT} .*web* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebEMailExtrac.* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebFetch* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebMiner* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebMirror* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebReaper* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebSauger* [OR] RewriteCond %{HTTP_USER_AGENT} .*Website* [OR] RewriteCond %{HTTP_USER_AGENT} .*Website\ eXtractor* [OR] RewriteCond %{HTTP_USER_AGENT} .*Webster* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebStripper* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebStripper/2.09* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebWhacker* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebZIP* [OR] RewriteCond %{HTTP_USER_AGENT} .*Wget* [OR] RewriteCond %{HTTP_USER_AGENT} .*WebHook* [OR] RewriteCond %{HTTP_USER_AGENT} .*Whacker* [OR] RewriteCond %{HTTP_USER_AGENT} .*Widow* [OR] RewriteCond %{HTTP_USER_AGENT} .*whizbang* [OR] RewriteCond %{HTTP_USER_AGENT} .*Xaldon* [OR] RewriteCond %{HTTP_USER_AGENT} .*Xaldon\ WebSpider* [OR] RewriteCond %{HTTP_USER_AGENT} .*Xenu* [OR] RewriteCond %{HTTP_USER_AGENT} .*x-Tractor* [OR] RewriteCond %{HTTP_USER_AGENT} .*Zeus.*Webster* [OR] RewriteCond %{HTTP_USER_AGENT} .*Zeus* RewriteRule ^.*$ http://google.fr [L,R]
En fait c'était pour ne pas prendre en compte les requêtes des robots dans mon compteur de visite (à la base) et accessoirement qu'une personne essayant d'aspirer le site se retrouve avec une copie de google.

Pourquoi certain était redirigé vers google et pas d'autre ?
Comment modifier/remplacer cela pour palier à ce problème ?

Rien quand testant mon url via différents site pour analyse mon compteur de visite à explosé depuis la suppression des lignes précédentes de mon htaccess.

D'avance merci pour vos commentaires.

Posté : 12 mai 2009, 22:16
par Ryle
Je suppose qu'à vouloir interdire l'accès à ton site à quelques 95% des agents qui pourraient tenter d'y accéder pour éviter qu'on ne l'aspire (sachant que la grande majorité des aspirateurs permettent de changer le user agent), ça doit également dégager bon nombre de bots qui étaient pourtant gentiement venus voir s'il y avait quelque chose à référencer... :?

Faut dire que les critères de rejet de ton htaccess sont parfois un peu sauvage... dégager tout ce qui contient "getright" peut laisser présager que getright ne pourra pas passer... mais dégager tout ce qui contient "html" ou "http" ou "DA" ou "web" dans son user agent, ca ne m'étonne pas que ton site ait du mal à se faire référencer et que certains, selon leur navigateur, se fassent également dégager :)

Au lieu de bloquer l'accès à ton site à tout ceux qui se présentent, laisse les entrer et utilise un outil de stat web pour comptabiliser tes véritables visiteurs (awstat, google analytics et compagnie savent très bien distinguer les bots, des aspirateurs, des visiteurs uniques :)).

Posté : 17 mai 2009, 19:57
par bunk
Effectivement.

J'ai fais mon lourd sur ce coup la. C'est dommage parce que n'étant pas un pro expert du PHP j'étais super fier de mettre en ligne ce site qui normalement respecte pas mal de norme en tout genre. Mais j'ai fais ma boulette.

Ça ma permis de chercher encore plus d'infos dans un domaine que je ne maitrise pas vraiment.

Merci.