Question 1

Preciso de um arquivo robots.txt?

Accepted Answer

Não é obrigatório, mas é útil para declarar regras de rastreamento e informar o local do sitemap. Sem ele, crawlers compatíveis podem solicitar qualquer URL pública que descobrirem.

Question 2

Posso enviar esse arquivo direto mesmo sem ser técnico?

Accepted Answer

Sim. O gerador segue o protocolo padrão de exclusão de robôs. Para um site de marketing comum, o preset que permite tudo mais a URL do sitemap costuma bastar.

Question 3

Como bloqueio ChatGPT ou outros crawlers de IA?

Accepted Answer

Use o preset de bloqueio de crawlers de IA. Ele adiciona regras de disallow para crawlers comuns relacionados a IA, mas robots.txt é voluntário. Ele orienta crawlers educados, não funciona como segurança de acesso.

Question 4

Robots.txt protege páginas privadas?

Accepted Answer

Não. robots.txt é público e não deve ser usado como proteção. Dashboards privados, builds de teste e arquivos de clientes ainda precisam de autenticação, controles noindex ou restrições de rede.

Question 5

Qual é a diferença entre noindex e Disallow?

Accepted Answer

Disallow diz aos crawlers para não buscar um caminho. noindex diz aos mecanismos de busca para não manter uma página nos resultados. Se um crawler não puder buscar a página por causa do disallow, talvez ele nem veja a tag noindex da página.

Frameworks

Casos de uso

Essenciais para devs

Frontend e design

Rede e SEO

Gerador de robots.txt

Editor de regras

Prévia do arquivo: robots.txt

Referência de robots.txt

User-agent: *

Disallow: /private/

Allow: /private/image.jpg

Sitemap: URL

Perguntas frequentes

Preciso de um arquivo robots.txt?

Posso enviar esse arquivo direto mesmo sem ser técnico?

Como bloqueio ChatGPT ou outros crawlers de IA?

Robots.txt protege páginas privadas?

Qual é a diferença entre noindex e Disallow?