**TL;DR.** `llms.txt` é o equivalente de AEO (Otimização de Motores de Resposta) de `robots.txt` + `sitemap.xml` combinado — um arquivo Markdown na raiz do seu site que informa aos motores de IA sobre o que seu site trata e onde encontrar informações estruturadas. Em 2026, lojas de ecommerce sem llms.txt estarão perdendo oportunidades de citação.

## O que é llms.txt

Um simples arquivo Markdown em `https://seudominio.com/llms.txt`. É um padrão comunitário proposto por Jeremy Howard (fast.ai) em 2024 e adotado oportunisticamente por Anthropic, Perplexity e outros motores de IA.

A estrutura:

```markdown
# Nome da Marca

> Um resumo de 1-2 frases sobre o que a marca faz e quem ela atende.

## Sobre

Descrição breve de 200 palavras sobre a marca.

## Produtos

- [Categoria de produto 1](https://example.com/categories/cat-1) — descrição curta
- [Categoria de produto 2](https://example.com/categories/cat-2) — descrição curta

## Documentação

- [Central de ajuda](https://example.com/help)
- [Documentação da API](https://example.com/docs)

## Preços

- [Página de preços](https://example.com/pricing)

## Opcional

- [Blog](https://example.com/blog)
- [Páginas de comparação](https://example.com/compare)
- [Glossário](https://example.com/glossary)
```

É isso. Markdown simples, bem abaixo de 5KB.

## Por que os motores de IA se importam

Rastrear um site de ecommerce com 50.000 páginas é caro. Motores de IA que indexam para recuperação (Perplexity, ChatGPT Search) e motores de IA que treinam (Anthropic, OpenAI) se beneficiam de um ponto de entrada curado.

llms.txt oferece a eles:

1. Uma descrição canônica da marca no formato preferido do motor (Markdown).
2. Um mapa de seções de alta prioridade, não links enterrados.
3. Indicações para conteúdos mais profundos (llms-full.txt, gêmeos Markdown).

Páginas citadas em llms.txt e páginas com gêmeos Markdown são observavelmente mais propensas a serem citadas nas respostas de IA. O consenso da pesquisa em 2025–2026 estima uma probabilidade de citação de 3–5x para páginas com essas superfícies em comparação com páginas sem.

## llms-full.txt para recuperação profunda

`llms.txt` é um índice estilo sitemap. `llms-full.txt` é o companheiro de longa forma que contém o corpo Markdown real de cada documento público.

```markdown
# Nome da Marca — Base de Conhecimento Completa

## Seção: Visão Geral da Marca

[Descrição da marca de 200 palavras]

## Seção: Preços

[Matriz de preços completa como tabela Markdown]

## Seção: FAQ

### Q: Como funciona a precificação?
A: ...

### Q: ...

## Seção: Comparações

### Comparação: Marca vs Shopify

[Texto completo da página de comparação]

### Comparação: Marca vs BigCommerce

[Texto completo]

## Seção: Glossário

### AEO
AEO (Otimização de Motores de Resposta) é...

### llms.txt
Um arquivo Markdown em...
```

Tamanho alvo: 50–500KB. Maior é aceitável; motores de IA o buscam de forma preguiçosa.

O padrão é: o motor busca llms.txt para entender sua marca, depois opcionalmente busca llms-full.txt para recuperação no momento da resposta.

## Gêmeos Markdown

Para cada Artigo público (post de blog, guia, comparação, história de cliente, entrada de glossário), emita um gêmeo Markdown no mesmo caminho + sufixo `.md`:

| URL HTML                                         | Gêmeo Markdown                                       |
| ------------------------------------------------ | --------------------------------------------------- |
| `/blog/inp-optimization-2026`                     | `/blog/inp-optimization-2026.md`                    |
| `/compare/ordiko-vs-shopify`                      | `/compare/ordiko-vs-shopify.md`                     |
| `/guides/migrate-from-shopify-to-ordiko`           | `/guides/migrate-from-shopify-to-ordiko.md`          |
| `/glossary/aeo`                                   | `/glossary/aeo.md`                                  |

Referencie a versão Markdown em seu HTML:

```html
<link rel="alternate" type="text/markdown" href="/blog/inp-optimization-2026/raw.md" />
```

A versão Markdown deve ter o mesmo conteúdo que a página HTML, menos a navegação — apenas o corpo do artigo. Use os cabeçalhos, listas, tabelas e cercas de código Markdown apropriados.

## Política de rastreamento de IA em robots.txt

Permita explicitamente os motores que você deseja que citem você:

```
User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: CCBot
Allow: /

# Negar acesso a caminhos privados/sensíveis para todos os rastreadores
User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /api
Disallow: /admin
```

Os nomes dos user-agents:

| User-Agent          | Motor               | Propósito                           |
| ------------------- | ------------------ | ----------------------------------- |
| `GPTBot`            | OpenAI             | Coleta de dados de treinamento       |
| `ChatGPT-User`      | OpenAI             | Navegação do ChatGPT a pedido do usuário |
| `OAI-SearchBot`     | OpenAI             | Índice de busca do ChatGPT          |
| `ClaudeBot`         | Anthropic          | Recuperação do Claude.ai            |
| `anthropic-ai`      | Anthropic          | Coleta de dados de treinamento       |
| `PerplexityBot`     | Perplexity         | Índice da Perplexity                |
| `Google-Extended`   | Google             | Opt-in para treinamento do Bard/Gemini |
| `CCBot`             | Common Crawl       | Conjunto de dados aberto (usado por muitas IAs) |

## Padrões de conteúdo que são citados

Motores de IA analisam o conteúdo como texto e preferem:

1. **Respostas definicionais diretas nas primeiras 60 palavras.** Comece com a resposta.
2. **Perguntas H2, sub-perguntas H3.** Cabeçalhos hierárquicos = estrutura analisável.
3. **Tabelas Markdown para dados comparáveis.** Motores de IA entendem bem tabelas.
4. **Estatísticas numeradas com ano.** "Em 2026, 73% dos comerciantes..." é mais citável do que "A maioria dos comerciantes...".
5. **Cite suas fontes.** Inclua links `[Fonte](url)` — motores de IA ponderam conteúdo citado mais alto.
6. **Blocos de FAQ.** O formato de pergunta e resposta é fortemente favorecido por sistemas de recuperação.

Evite:

- Pirâmides invertidas (introdução, depois contexto, depois conclusão) — motores de IA frequentemente citam a introdução e pulam o resto.
- Longas paredes de texto sem estrutura.
- Conteúdo oculto "Clique para expandir" que os rastreadores não conseguem ver.
- Dependência excessiva de imagens sem texto alternativo.

## Monitorando o tráfego de IA

Nos seus logs de servidor, conte as solicitações por user agent:

```bash
grep -oE "(GPTBot|ChatGPT-User|ClaudeBot|PerplexityBot)" access.log | sort | uniq -c
```

Você deve ver tráfego desses bots assim que eles descobrirem seu llms.txt. O volume cresce ao longo das semanas à medida que os motores rastreiam e re-rastreiam.

Para monitorar citações:

- Pesquise o nome da sua marca no Perplexity, ChatGPT, Claude, Gemini. Anote quais páginas são citadas.
- Use ferramentas de monitoramento de marca (Brand24, Mention) que rastreiam cada vez mais menções de IA.
- Configure uma revisão trimestral: consulte "melhor plataforma [sua categoria]" em cada motor de IA e documente quem é citado.

## Como a Ordiko lida com AEO

A Ordiko fornece:

- `/llms.txt` gerado automaticamente por loja e por apex.
- `/llms-full.txt` concatenando o corpo completo em Markdown de cada documento de marketing.
- Gêmeos Markdown de cada post de blog, guia, comparação, história de cliente, entrada de glossário.
- Regras de permissão para rastreadores de IA em rotas de marketing; proibição em carrinho/checkout/conta.
- Modelos de conteúdo citáveis: introdução TL;DR, perguntas H2, tabelas, blocos de FAQ, estatísticas numeradas.

Nenhuma configuração é necessária.

## FAQ

**O llms.txt é um padrão oficial?**
É um padrão comunitário proposto por Jeremy Howard em 2024 e adotado por Anthropic, Perplexity e outros. Não há especificação do W3C ou IETF. Motores de IA o buscam oportunisticamente ao descobrir um domínio. Trate-o como uma boa prática, não como conformidade estrita.

**O llms.txt fará meu site ter uma classificação mais alta no Google?**
Não diretamente. O SERP clássico do Google não lê llms.txt. Os benefícios de sinalização são para citação em busca de IA (Perplexity, ChatGPT Search, Claude) e Visões Gerais de IA do Google indiretamente via semântica de conteúdo mais limpa.

**Devo bloquear rastreadores de IA para proteger meu conteúdo?**
Para a maioria das lojas de ecommerce, não. Bloquear o GPTBot/ClaudeBot/PerplexityBot de suas rotas de marketing garante que você não seja citado quando os usuários perguntam aos motores de IA sobre sua categoria. A troca é que os motores de IA treinam com seu conteúdo; para ecommerce, isso é uma característica, não um bug.

**Como a Ordiko lida com llms.txt?**
A Ordiko gera automaticamente llms.txt e llms-full.txt por loja a partir do catálogo e da coleção de conteúdo, com invalidação de cache vinculada a mutações de conteúdo. Gêmeos Markdown são emitidos em /blog/[slug].md, /compare/[slug].md, etc. A configuração é sem toque.