Bloquear o acesso ao conteúdo no seu site

Este artigo explica como bloquear o acesso ao conteúdo no seu site.

Alguns dos conteúdos que você publica podem não ser relevantes para inclusão no Google Notícias. É possível restringir o acesso do Google a determinados conteúdos bloqueando o acesso dos bots rastreadores do Google, o Googlebot e o Googlebot-News.

Criar um arquivo robots.txt

Use um arquivo robots.txt para ter um alto nível de controle sobre as partes do seu site que poderão ser exibidas na Pesquisa Google e no Google Notícias. Saiba mais sobre arquivos robots.txt.

É possível bloquear o acesso das seguintes maneiras:

  • Para evitar que seu site apareça no Google Notícias, bloqueie o acesso do Googlebot-News usando um arquivo robots.txt.

  • Para evitar que seu site apareça no Google Notícias e na Pesquisa Google, bloqueie o acesso do Googlebot usando um arquivo robots.txt.

Conceda a nosso rastreador acesso ao seu arquivo robots.txt para que possamos ver que seções do site você não quer que sejam rastreadas.

Criar uma metatag

Você pode adicionar metatags a uma página HTML. As metatags informam aos mecanismos de pesquisa quais limites se aplicam quando as páginas são exibidas nos resultados da pesquisa. Saiba como bloquear a indexação da pesquisa com as metatags.

Veja algumas metatags comuns que podem ser adicionadas às páginas HTML:

  • Para impedir que artigos específicos do seu site sejam exibidos no Google Notícias, bloqueie o acesso do Googlebot-News usando a seguinte metatag: <meta name="Googlebot-News" content="noindex, nofollow">.

  • Para impedir que artigos específicos do seu site sejam exibidos no Google Notícias e na Pesquisa Google, bloqueie o acesso do Googlebot usando a seguinte metatag: <meta name="googlebot" content="noindex, nofollow">.

  • Para impedir que artigos específicos do seu site sejam indexados por todos os robôs, use a seguinte metatag: <meta name="robots" content="noindex, nofollow">.

  • Para impedir que os robôs rastreiem imagens de um artigo específico, use a seguinte metatag: <meta name="robots" content="noimageindex">.

  • Para nos informar que um artigo precisa ser removido do índice do Google em um determinado horário, use a seguinte metatag: <meta name="googlebot" content="unavailable_after: 25-Aug-2011 15:00:00 EST">.

  • Especifique a hora e a data no formato RFC 850. Essa metatag é tratada como uma solicitação de remoção. Leva cerca de um dia após a data de remoção para que a página desapareça dos resultados da pesquisa. No entanto, para que a tag funcione corretamente, ela precisa ser incluída no seu artigo logo no primeiro rastreamento.

  • Há outras opções para limitar o conteúdo exibido em um resultado da pesquisa. Saiba mais na documentação do desenvolvedor.

Especificações do cabeçalho HTTP

Você também pode fornecer instruções para os robôs no cabeçalho da resposta HTTP. Para saber mais, confira nossas especificações para cabeçalhos HTTP.

Importante: o Google segue a interpretação mais restritiva da escolha do seu bot.

Pesquisa
Limpar pesquisa
Fechar pesquisa
Menu principal
16194953701607960355
true
Pesquisar na Central de Ajuda
true
true
true
true
true
100499
false
false