**TL;DR.** `llms.txt` es el equivalente de AEO (Optimización del Motor de Respuestas) de `robots.txt` + `sitemap.xml` combinado: un archivo Markdown en tu raíz que le dice a los motores de IA de qué trata tu sitio y dónde encontrar información estructurada. En 2026, las tiendas de comercio electrónico sin llms.txt estarán dejando oportunidades de citación sobre la mesa.

## Qué es llms.txt

Un simple archivo Markdown en `https://yourdomain.com/llms.txt`. Es un estándar comunitario propuesto por Jeremy Howard (fast.ai) en 2024 y adoptado oportunamente por Anthropic, Perplexity y otros motores de IA.

La estructura:

```markdown
# Nombre de la Marca

> Un resumen de 1-2 oraciones sobre lo que hace la marca y a quién sirve.

## Acerca de

Descripción breve de 200 palabras sobre la marca.

## Productos

- [Categoría de producto 1](https://example.com/categories/cat-1) — descripción corta
- [Categoría de producto 2](https://example.com/categories/cat-2) — descripción corta

## Documentación

- [Centro de ayuda](https://example.com/help)
- [Documentación de API](https://example.com/docs)

## Precios

- [Página de precios](https://example.com/pricing)

## Opcional

- [Blog](https://example.com/blog)
- [Páginas de comparación](https://example.com/compare)
- [Glosario](https://example.com/glossary)
```

Eso es todo. Markdown simple, muy por debajo de 5KB.

## Por qué a los motores de IA les importa

Rastrear un sitio de comercio electrónico de 50,000 páginas es costoso. Los motores de IA que indexan para recuperación (Perplexity, ChatGPT Search) y los motores de IA que entrenan (Anthropic, OpenAI) se benefician de un punto de entrada curado.

llms.txt les proporciona:

1. Una descripción canónica de la marca en el formato preferido del motor (Markdown).
2. Un mapa de secciones de alta prioridad, no enlaces enterrados.
3. Indicaciones hacia contenido más profundo (llms-full.txt, gemelos de Markdown).

Las páginas citadas en llms.txt y las páginas con gemelos de Markdown son observablemente más propensas a ser citadas en las respuestas de IA. El consenso de la investigación en 2025–2026 estima una probabilidad de citación de 3–5 veces para páginas con estas superficies en comparación con páginas sin ellas.

## llms-full.txt para recuperación profunda

`llms.txt` es un índice estilo sitemap. `llms-full.txt` es el compañero de formato largo que contiene el cuerpo Markdown real de cada documento público.

```markdown
# Nombre de la Marca — Base de Conocimientos Completa

## Sección: Descripción General de la Marca

[Descripción de la marca de 200 palabras]

## Sección: Precios

[Matriz de precios completa como tabla Markdown]

## Sección: Preguntas Frecuentes

### P: ¿Cómo funciona el precio?
R: ...

### P: ...

## Sección: Comparaciones

### Comparación: Marca vs Shopify

[Texto completo de la página de comparación]

### Comparación: Marca vs BigCommerce

[Texto completo]

## Sección: Glosario

### AEO
AEO (Optimización del Motor de Respuestas) es...

### llms.txt
Un archivo Markdown en...
```

Tamaño objetivo: 50–500KB. Más grande está bien; los motores de IA lo obtienen de manera perezosa.

El patrón es: el motor obtiene llms.txt para entender tu marca, luego opcionalmente obtiene llms-full.txt para recuperación en el momento de la respuesta.

## Gemelos de Markdown

Para cada Artículo público (publicación de blog, guía, comparación, historia de cliente, entrada de glosario), emite un gemelo de Markdown en la misma ruta + sufijo `.md`:

| URL HTML                                         | Gemelo de Markdown                                       |
| ------------------------------------------------ | --------------------------------------------------- |
| `/blog/inp-optimization-2026`                     | `/blog/inp-optimization-2026.md`                    |
| `/compare/ordiko-vs-shopify`                      | `/compare/ordiko-vs-shopify.md`                     |
| `/guides/migrate-from-shopify-to-ordiko`           | `/guides/migrate-from-shopify-to-ordiko.md`          |
| `/glossary/aeo`                                   | `/glossary/aeo.md`                                  |

Referencia la versión Markdown en tu HTML:

```html
<link rel="alternate" type="text/markdown" href="/blog/inp-optimization-2026/raw.md" />
```

La versión Markdown debe ser el mismo contenido que la página HTML menos el chrome de navegación: solo el cuerpo del artículo. Usa encabezados, listas, tablas y cercas de código Markdown apropiados.

## Política de rastreo de IA en robots.txt

Permite explícitamente los motores que deseas que te citen:

```
User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: CCBot
Allow: /

# Denegar acceso a rutas privadas/sensibles para todos los rastreadores
User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /api
Disallow: /admin
```

Los nombres de los user-agent:

| User-Agent          | Motor               | Propósito                           |
| ------------------- | ------------------ | --------------------------------- |
| `GPTBot`            | OpenAI             | Recolección de datos de entrenamiento           |
| `ChatGPT-User`      | OpenAI             | Navegación de ChatGPT a solicitud del usuario   |
| `OAI-SearchBot`     | OpenAI             | Índice de búsqueda de ChatGPT               |
| `ClaudeBot`         | Anthropic          | Recuperación de Claude.ai                |
| `anthropic-ai`      | Anthropic          | Recolección de datos de entrenamiento           |
| `PerplexityBot`     | Perplexity         | Índice de Perplexity                  |
| `Google-Extended`   | Google             | Opt-in de entrenamiento de Bard/Gemini        |
| `CCBot`             | Common Crawl       | Conjunto de datos abierto (utilizado por muchas IA)    |

## Patrones de contenido que se citan

Los motores de IA analizan el contenido como texto y prefieren:

1. **Respuestas definitorias directas en las primeras 60 palabras.** Comienza con la respuesta.
2. **Preguntas H2, sub-preguntas H3.** Encabezados jerárquicos = estructura analizable.
3. **Tablas Markdown para datos comparables.** Los motores de IA entienden bien las tablas.
4. **Estadísticas numeradas con año.** "En 2026, el 73% de los comerciantes..." es más citables que "La mayoría de los comerciantes...".
5. **Cita tus fuentes.** Incluye enlaces `[Fuente](url)` — los motores de IA ponderan el contenido citado más alto.
6. **Bloques de preguntas frecuentes.** El formato de pregunta y respuesta es muy favorecido por los sistemas de recuperación.

Evita:

- Pirámides invertidas (introducción, luego contexto, luego conclusión) — los motores de IA a menudo citan la introducción y omiten el resto.
- Paredes de texto de párrafos largos sin estructura.
- Contenido oculto "Haz clic para expandir" que los rastreadores no pueden ver.
- Dependencia excesiva de imágenes sin texto alternativo.

## Monitoreo del tráfico de IA

En tus registros del servidor, cuenta las solicitudes por agente de usuario:

```bash
grep -oE "(GPTBot|ChatGPT-User|ClaudeBot|PerplexityBot)" access.log | sort | uniq -c
```

Deberías ver tráfico de estos bots una vez que descubran tu llms.txt. El volumen crece con el tiempo a medida que los motores rastrean y vuelven a rastrear.

Para monitorear citas:

- Busca el nombre de tu marca en Perplexity, ChatGPT, Claude, Gemini. Toma nota de qué páginas son citadas.
- Usa herramientas de monitoreo de marcas (Brand24, Mention) que rastrean cada vez más menciones de IA.
- Establece una revisión trimestral: consulta "mejor plataforma de [tu categoría]" en cada motor de IA y documenta quién es citado.

## Cómo Ordiko maneja AEO

Ordiko envía:

- `/llms.txt` auto-generado por tienda y por apex.
- `/llms-full.txt` concatenando el cuerpo completo en Markdown de cada documento de marketing.
- Gemelos de Markdown de cada publicación de blog, guía, comparación, historia de cliente, entrada de glosario.
- Reglas de permiso para rastreadores de IA en rutas de marketing; denegar en carrito/checkout/cuenta.
- Plantillas de contenido citables: introducción TL;DR, preguntas H2, tablas, bloques de preguntas frecuentes, estadísticas numeradas.

No se requiere configuración.

## Preguntas Frecuentes

**¿Es llms.txt un estándar oficial?**
Es un estándar comunitario propuesto por Jeremy Howard en 2024 y adoptado por Anthropic, Perplexity y otros. No hay una especificación de W3C o IETF. Los motores de IA lo obtienen oportunamente al descubrir un dominio. Trátalo como una buena práctica, no como un cumplimiento estricto.

**¿Harán que mi sitio tenga un mejor ranking en Google?**
No directamente. El SERP clásico de Google no lee llms.txt. Los beneficios de señal de citación de búsqueda de IA (Perplexity, ChatGPT Search, Claude) y las Visiones de IA de Google indirectamente a través de semánticas de contenido más limpias.

**¿Debería bloquear a los rastreadores de IA para proteger mi contenido?**
Para la mayoría de las tiendas de comercio electrónico, no. Bloquear a GPTBot/ClaudeBot/PerplexityBot de tus rutas de marketing garantiza que no te citen cuando los usuarios pregunten a los motores de IA sobre tu categoría. La compensación es que los motores de IA entrenan con tu contenido; para el comercio electrónico, eso es una característica, no un error.

**¿Cómo maneja Ordiko llms.txt?**
Ordiko auto-genera llms.txt y llms-full.txt por tienda a partir del catálogo y la colección de contenido, con invalidación de caché vinculada a mutaciones de contenido. Los gemelos de Markdown se emiten en /blog/[slug].md, /compare/[slug].md, etc. La configuración es sin contacto.