Page 1 sur 1

Désindexé des pages https

Posté : 13 déc. 2016, 21:52
par blinz
Salut à tous.
J'aimerais savoir comment on peut faire pour supprimer de l'index de google des pages enregistré en https svp
Via un robots txt peut etre.
Si vous avez une idée
ou un htacces peut etre.
Merci à vous

Re: Désindexé des pages https

Posté : 13 déc. 2016, 23:32
par @rthur
Bonjour,

Juste une précision : tu as des pages accessibles à la fois en HTTP _ET_ en HTTPS ? C'est à dire avec le même contenu, et tu voudrais ne conserver que celle en http, c'est bien cela ?

Si oui, alors mon conseil serait plutôt que tu fasses l'inverse à savoir que tu rediriges toutes tes pages http vers leur équivalent en https (via un htaccess c'est faisable facilement).


Si c'est juste que tu as des pages en https que tu veux désindexer (mais sans leur équivalent en http), alors il suffit d'un simple robots.txt exactement comme tu le ferai en http.
:arrow: + d'infos : http://robots-txt.com

Tu peux aussi, une fois que tu as mis le robots.txt en place, aller dans la Google Search Console pour demander à Google que la suppression soit quasi-immédiate.
:arrow: + d'infos : https://support.google.com/webmasters/a ... 3419?hl=fr

Re: Désindexé des pages https

Posté : 14 déc. 2016, 00:09
par blinz
Alors en fait j'avais prit un protocole https lets encrypt mais pas convaincu par la chose j'ai décidé de resté en http.
Donc j'ai supprimé ce fameux protocole https depuis ... mais quelque pages se sont indexé en https entre temps et je souhaite tout simplement les supprimé des index des robots

Re: Désindexé des pages https

Posté : 14 déc. 2016, 00:38
par @rthur
Si tu clic sur ces liens dans Google, ça renvoie une erreur ?

Si oui, alors Google va les supprimer de lui même dans quelques semaines.

La solution propre aurait été que tu conserves le HTTPS mais en forçant la redirection en 301 vers le http afin de faire comprendre à Google que cette page avait déménagée.

Re: Désindexé des pages https

Posté : 14 déc. 2016, 11:31
par blinz
Salut,
alors je fait la commande site:monsite.fr sur google et me balade un peu dans la pagination jusqu'à ce que je tombe sur un lien en https:

J'ai donc par exemple:
https://monsite.fr/sortie/tryo/concert/ ... 81837.html
Si je clique dessus connexion pas sécurisé ....

La vraie adresse étant http://monsite.fr/sortie/tryo/concert/b ... 81837.html

Je me demandé si il n y avait pas une regle coté htaccess pour ce genre de problème justement.
Notamment la règle suivante :
RewriteCond %{HTTPS} ^on$ [NC]
RewriteRule ^(.*)$ http://%{HTTP_HOST}/$1  [R=301,L]
Mais pas convaincu, peut etre que je l'ai mal place ds le htaccess, je ne pense pas.
Ou tout simplement une règle inutile...

PS: je constate une erreur surprenante dans les cache de google pour certaines pages :
ERREUR 404 mais que sur les caches ...

Re: Désindexé des pages https

Posté : 14 déc. 2016, 12:35
par @rthur
Le htaccess ne fonctionnera que si ton HTTPS fonctionne. Là tu as une erreur de certificat donc le navigateur ne va même pas aller plus loin.
Soit tu rétablis un SSL correct, soit tu le désactive complètement, mais à l'heure actuelle tu es dans un état bancale et c'est ce qui provoque tes soucis.

Une autre solution serait que tu bascules ton DNS chez Cloudflare qui va te mettre gratuitement à disposition un certificat SSL.
C'est gratuit et ça se fait en quelques minutes sans manipulation technique.

Et ensuite tu forces toutes tes url en full https