Skip to main content Help Control Panel

 

support «   Soupçons de bogues «  

Peut-on se cacher de Google ?

Alain Lesage -- on Oct. 17 2008, from Montréal ou Chambly, Québec
YACS team (Quebec)

WorkflowSupport request
StatusProblem has been recorded
  • Submission on Oct. 17 2008 by Lasares
OwnerAlain Lesage
Progress0%
Dans control/configure.php, à l'option Visibilité, j'ai choisi "Ce serveur n'est pas accessible depuis Internet", croyant que cela me cacherait des robots d'indexation, comme le laisse supposer l'alternative qui est offerte dans l'option.

Pourtant, j'ai encore, dans le code source de ma page, la balise < meta name="robots" content="index, follow" / >. C'est un bogue ou j'ai mal interprété l'utilité de cette option ?

Jusqu'à maintenant, j'insérais la balise appropriée dans l'En-tête offerte par skins/configure.php (récemment rebaptisée Fabrication des pages).

Comments


Bernard Paquesfrom nearby-an-airport
Associate, 8372 posts

on Oct. 20 2008


Cher Alain, dans l'absolu, un robot pourrait être installé sur le réseau interne de l'entreprise, et c'est d'ailleurs ce que font de plus en plus de sociétés, par exemple en achetant des engins de recherche fournis par Google, mais installés sur des réseaux privés. Donc la balise "robots" doit rester active, que le serveur soit visible sur Internet ou pas.

Alain Lesagefrom Montréal ou Chambly, Québec
1365 posts

on Oct. 20 2008


Alors, il sert à quoi, ce réglage ? Et il a quel effet ?

-----
On a si peu d'idée de ce qui est possible...

Bernard Paquesfrom nearby-an-airport
Associate, 8372 posts

on Oct. 20 2008


Avec ce réglage, yacs ne tente pas de lier ses propres fils d'information aux aggrégateurs publics par exemple.

Alain Lesagefrom Montréal ou Chambly, Québec
1365 posts

on Oct. 20 2008


Mais si Google peut encore l'indexer, il vaudrait mieux modifier le texte des choix pour être plus explicite. Il est facile de croire que le second choix de ce paramètre signifie, a contrario, que "Le contenu public N'est PAS traité par les moteurs de recherche et les aggrégateurs d'information."

-----
On a si peu d'idée de ce qui est possible...

J.Juraverfrom Entre chaise et clavier...
3710 posts

on Jan. 14 2010


Je suis plutôt favorable à une explicitation in situ plus évidente, l'actuelle porte clairement à confusion, si bien que j'en ai ouvert moi aussi une discussion sans avoir vu la présente...

Egalement, une proposition de débat consécutive : Choix d'envoi et création de RSS selon les sections




Je ne m'attarde pas, j'ai mon yacs en double file...

Yacs on my blog | Suivez le blog Yacs | Yacs Showroom | Plugin Firefox de recherche dans Yetanoz |

Bernard Paquesfrom nearby-an-airport
Associate, 8372 posts

on Mar. 30 2010


J'ai changé les libellés utilisés, pour être plus clair sur ce réglage. En anglais, cela donne :

Internet connectivity:

  • Server is reachable from public web crawlers and news aggregators.

  • Server is not connected to the Internet.

Dans le deuxième cas, yacs ne propose pas de partager une page sur Twitter par exemple, puisqu'il sait que la machine n'est pas visible depuis Internet.


Alain Lesagefrom Montréal ou Chambly, Québec
1365 posts

on Mar. 31 2010


Bon d'accord, le réglage en question sera peut-être plus clair à la prochaine livraison, mais ma question reste entière : Peut-on se cacher de Google ?

Je veux dire : si on le désire, avec Yacs, peut-on indiquer aux robots de ne pas indexer ? Il semble que Yacs rajoute dans tous les cas la balise suivante :

<meta name="robots" content="index, follow" />

Et ceci, même si je mets dans mon template une balise meta qui dit l'inverse. Et je ne suis pas certain du tout du comportement d'un robot qui se ferait dire, à quelques lignes d'intervalle, « suis-moi », « suis-moi pas ».

Pourquoi je voudrais empêcher Google d'indexer le site ? Parce que je suis en train de le construire, que je veux que mes clients y aient accès de la même façon qu'après la mise en ligne officielle, mais qu'il est trop tôt pour envoyer mon communiqué de presse à Google.


J.Juraverfrom Entre chaise et clavier...
3710 posts

on Mar. 31 2010


J'avoue me confronter aux mêmes problématiques : la solution radicale pour l'instant que j'emploie, c'est un htpassword dès l'entrée du site. Les clients peuvent comprendre ça. Ca rassure même.

Si je qualifie ça de radical, c'est que de toutes façons je n'ai pas confiance dans la règle du robots.txt, qui ne me semble pas respectée par tous les crawlers. A la rigueur ils sont assez malins pour piger qu'il vaut mieux revenir crawler dans une semaine, dans l'absolu ils n'ont aucun interêt à respecter "ne poursuis pas" du moment que le site est tombé dans leur filet.




Je ne m'attarde pas, j'ai mon yacs en double file...

Yacs on my blog | Suivez le blog Yacs | Yacs Showroom | Plugin Firefox de recherche dans Yetanoz |