Bernard Paquesfrom nearby-an-airport Associate, 8372 posts | Cher Alain, dans l'absolu, un robot pourrait être installé sur le réseau interne de l'entreprise, et c'est d'ailleurs ce que font de plus en plus de sociétés, par exemple en achetant des engins de recherche fournis par Google, mais installés sur des réseaux privés. Donc la balise "robots" doit rester active, que le serveur soit visible sur Internet ou pas. |
Alain Lesagefrom Montréal ou Chambly, Québec 1365 posts | Alors, il sert à quoi, ce réglage ? Et il a quel effet ? -----
On a si peu d'idée de ce qui est possible... |
Bernard Paquesfrom nearby-an-airport Associate, 8372 posts | Avec ce réglage, yacs ne tente pas de lier ses propres fils d'information aux aggrégateurs publics par exemple. |
Alain Lesagefrom Montréal ou Chambly, Québec 1365 posts | Mais si Google peut encore l'indexer, il vaudrait mieux modifier le texte des choix pour être plus explicite. Il est facile de croire que le second choix de ce paramètre signifie, a contrario, que "Le contenu public N'est PAS traité par les moteurs de recherche et les aggrégateurs d'information." -----
On a si peu d'idée de ce qui est possible... |
![]() J.Juraverfrom Entre chaise et clavier... 3710 posts | Je suis plutôt favorable à une explicitation in situ plus évidente, l'actuelle porte clairement à confusion, si bien que j'en ai ouvert moi aussi une discussion sans avoir vu la présente... Egalement, une proposition de débat consécutive : Choix d'envoi et création de RSS selon les sections ----- Yacs on my blog | Yacs on social media | Yacs Showroom | Plugin Firefox de recherche dans Yetanoz | Find Yacs anywhere with your phone! Je ne m'attarde pas, j'ai mon yacs en double file...
![]() Yacs on my blog | Suivez le blog Yacs | Yacs Showroom | Plugin Firefox de recherche dans Yetanoz | |
Bernard Paquesfrom nearby-an-airport Associate, 8372 posts | J'ai changé les libellés utilisés, pour être plus clair sur ce réglage. En anglais, cela donne : Internet connectivity:
Dans le deuxième cas, yacs ne propose pas de partager une page sur Twitter par exemple, puisqu'il sait que la machine n'est pas visible depuis Internet. |
Alain Lesagefrom Montréal ou Chambly, Québec 1365 posts | Bon d'accord, le réglage en question sera peut-être plus clair à la prochaine livraison, mais ma question reste entière : Peut-on se cacher de Google ? Je veux dire : si on le désire, avec Yacs, peut-on indiquer aux robots de ne pas indexer ? Il semble que Yacs rajoute dans tous les cas la balise suivante : <meta name="robots" content="index, follow" /> Et ceci, même si je mets dans mon template une balise meta qui dit l'inverse. Et je ne suis pas certain du tout du comportement d'un robot qui se ferait dire, à quelques lignes d'intervalle, « suis-moi », « suis-moi pas ». Pourquoi je voudrais empêcher Google d'indexer le site ? Parce que je suis en train de le construire, que je veux que mes clients y aient accès de la même façon qu'après la mise en ligne officielle, mais qu'il est trop tôt pour envoyer mon communiqué de presse à Google. |
![]() J.Juraverfrom Entre chaise et clavier... 3710 posts | J'avoue me confronter aux mêmes problématiques : la solution radicale pour l'instant que j'emploie, c'est un htpassword dès l'entrée du site. Les clients peuvent comprendre ça. Ca rassure même. Si je qualifie ça de radical, c'est que de toutes façons je n'ai pas confiance dans la règle du robots.txt, qui ne me semble pas respectée par tous les crawlers. A la rigueur ils sont assez malins pour piger qu'il vaut mieux revenir crawler dans une semaine, dans l'absolu ils n'ont aucun interêt à respecter "ne poursuis pas" du moment que le site est tombé dans leur filet. Je ne m'attarde pas, j'ai mon yacs en double file...
![]() Yacs on my blog | Suivez le blog Yacs | Yacs Showroom | Plugin Firefox de recherche dans Yetanoz | |
support « Soupçons de bogues «
Peut-on se cacher de Google ?
| Workflow | Support request |
| Status | Problem has been recorded
|
| Owner | Alain Lesage |
| Progress | ![]() |
Dans control/configure.php, à l'option Visibilité, j'ai choisi "Ce serveur n'est pas accessible depuis Internet", croyant que cela me cacherait des robots d'indexation, comme le laisse supposer l'alternative qui est offerte dans l'option.
Pourtant, j'ai encore, dans le code source de ma page, la balise < meta name="robots" content="index, follow" / >. C'est un bogue ou j'ai mal interprété l'utilité de cette option ?
Jusqu'à maintenant, j'insérais la balise appropriée dans l'En-tête offerte par skins/configure.php (récemment rebaptisée Fabrication des pages).
Pourtant, j'ai encore, dans le code source de ma page, la balise < meta name="robots" content="index, follow" / >. C'est un bogue ou j'ai mal interprété l'utilité de cette option ?
Jusqu'à maintenant, j'insérais la balise appropriée dans l'En-tête offerte par skins/configure.php (récemment rebaptisée Fabrication des pages).















