⏱️ Tempo de leitura: 4 minutos
Nível: ⭐⭐⭐☆☆ (Intermediário)
Este artigo aborda:
O que é o arquivo robots.txt e sua função
Como acessar o robots.txt da sua loja
O que são os User-agents e quais bots estão cobertos
Por que ele não pode ser editado manualmente
Como resolver erros de páginas indisponíveis
O que é o robots.txt?
O robots.txt é um arquivo que orienta os robôs de busca (como o Googlebot) sobre quais páginas da sua loja podem ou não ser rastreadas. Ele funciona como um "guia de instruções" para os mecanismos de busca, indicando o que deve ser indexado e o que deve permanecer oculto.
Na Loja Integrada, esse arquivo é gerado e liberado automaticamente para todas as lojas, sem necessidade de configuração manual. Isso garante que as melhores práticas de SEO e segurança já estejam aplicadas desde o início.
Como acessar o robots.txt da sua loja
Para visualizar o arquivo, basta adicionar /robots.txt ao final do domínio da sua loja.
O arquivo lista as páginas e diretórios bloqueados para rastreamento, organizados por tipo de bot. Tudo que não aparece nas regras de bloqueio está automaticamente liberado para indexação — e a Loja Integrada já configura isso da forma ideal para sua loja.
O que são os User-agents no arquivo?
No início do robots.txt, você verá uma lista de User-agents — são os nomes dos robôs para os quais as regras do arquivo se aplicam. A Loja Integrada já inclui os principais:
Buscadores: Googlebot, Googlebot-image
Anúncios: AdsBot-Google, Mediapartners-Google
IAs generativas: GPTBot, ChatGPT-User, ClaudeBot, PerplexityBot, entre outros
Redes sociais: facebookexternalhit, meta-externalagent
Outros: Applebot-Extended
O User-agent: * funciona como coringa e define regras para qualquer bot não listado individualmente.
Isso significa que a plataforma já está preparada para lidar tanto com buscadores tradicionais quanto com crawlers de inteligência artificial e redes sociais — você não precisa se preocupar em atualizar essa lista manualmente.
Por que não posso editar o robots.txt?
O robots.txt na Loja Integrada segue um padrão de segurança criterioso definido pela plataforma. Ele bloqueia automaticamente páginas que contêm dados sensíveis, como a página do carrinho, área de checkout e informações de cadastro.
Essa configuração protege tanto a sua loja quanto os dados dos seus clientes, garantindo que informações privadas não sejam indexadas pelos buscadores.
Problemas com páginas indisponíveis
Se você está enfrentando erros de "página de destino indisponível" no Google Search Console, isso geralmente ocorre devido ao limite de throttling do Google — um mecanismo que controla a frequência de rastreamento.
💡 Para diagnosticar o problema, utilize o Google Rich Results, que permite verificar como os bots estão acessando suas páginas.
Você tem duas opções para resolver:
Aguardar naturalmente que o Googlebot revisite sua loja sem apresentar o erro
Solicitar manualmente que o Google não visite mais essas páginas específicas através do Google Search Console
Dúvidas frequentes
O robots.txt afeta o posicionamento da minha loja no Google?
Indiretamente, sim. Ele garante que apenas páginas relevantes sejam indexadas, evitando que conteúdos duplicados ou sensíveis prejudiquem seu SEO.
Se uma página não aparece no arquivo, significa que ela será indexada?
Sim. O robots.txt lista apenas o que está bloqueado. Páginas que não constam nas regras de bloqueio ficam liberadas para os buscadores — e a plataforma já define isso de forma otimizada para você.
Preciso me preocupar com a configuração do robots.txt?
Não. A Loja Integrada já configura o arquivo seguindo as melhores práticas de mercado, então você pode focar em outras estratégias de SEO para sua loja.
O robots.txt é uma camada importante de proteção e organização para sua loja nos mecanismos de busca, e na Loja Integrada, ele já vem pronto para funcionar.
#seo #robots #indexação #google #informativo
