**TL;DR.** `llms.txt` est l'équivalent de l'optimisation des moteurs de réponse (AEO) de `robots.txt` + `sitemap.xml` combinés — un fichier Markdown à la racine de votre site qui indique aux moteurs d'IA de quoi parle votre site et où trouver des informations structurées. En 2026, les magasins de commerce électronique sans llms.txt laissent des opportunités de citation sur la table.

## Ce qu'est llms.txt

Un simple fichier Markdown à `https://yourdomain.com/llms.txt`. C'est une norme communautaire proposée par Jeremy Howard (fast.ai) en 2024 et adoptée opportunément par Anthropic, Perplexity et d'autres moteurs d'IA.

La structure :

```markdown
# Nom de la Marque

> Un résumé en 1-2 phrases de ce que fait la marque et qui elle sert.

## À propos

Brève description de 200 mots de la marque.

## Produits

- [Catégorie de produit 1](https://example.com/categories/cat-1) — courte description
- [Catégorie de produit 2](https://example.com/categories/cat-2) — courte description

## Documentation

- [Centre d'aide](https://example.com/help)
- [Docs API](https://example.com/docs)

## Tarification

- [Page de tarification](https://example.com/pricing)

## Optionnel

- [Blog](https://example.com/blog)
- [Pages de comparaison](https://example.com/compare)
- [Glossaire](https://example.com/glossary)
```

C'est tout. Du Markdown simple, bien en dessous de 5 Ko.

## Pourquoi les moteurs d'IA s'en soucient

Explorer un site de commerce électronique de 50 000 pages est coûteux. Les moteurs d'IA qui indexent pour la récupération (Perplexity, ChatGPT Search) et les moteurs d'IA qui s'entraînent (Anthropic, OpenAI) bénéficient tous deux d'un point d'entrée curaté.

llms.txt leur donne :

1. Une description de marque canonique dans le format préféré du moteur (Markdown).
2. Une carte des sections prioritaires, pas de liens enfouis.
3. Des indications vers un contenu plus approfondi (llms-full.txt, jumeaux Markdown).

Les pages citées dans llms.txt et les pages avec des jumeaux Markdown sont visiblement plus susceptibles d'être citées dans les réponses d'IA. Le consensus de recherche en 2025–2026 estime une probabilité de citation de 3 à 5 fois plus élevée pour les pages avec ces surfaces par rapport aux pages sans.

## llms-full.txt pour une récupération approfondie

`llms.txt` est un index de style sitemap. `llms-full.txt` est le compagnon long format qui contient le corps Markdown réel de chaque document public.

```markdown
# Nom de la Marque — Base de Connaissances Complète

## Section : Aperçu de la Marque

[description de la marque de 200 mots]

## Section : Tarification

[Matrice de tarification complète sous forme de tableau Markdown]

## Section : FAQ

### Q : Comment fonctionne la tarification ?
R : ...

### Q : ...

## Section : Comparaisons

### Comparaison : Marque vs Shopify

[Texte complet de la page de comparaison]

### Comparaison : Marque vs BigCommerce

[Texte complet]

## Section : Glossaire

### AEO
AEO (Optimisation des Moteurs de Réponse) est...

### llms.txt
Un fichier Markdown à...
```

Taille cible : 50–500 Ko. Plus grand est acceptable ; les moteurs d'IA le récupèrent paresseusement.

Le schéma est : le moteur récupère llms.txt pour comprendre votre marque, puis récupère éventuellement llms-full.txt pour la récupération au moment de la réponse.

## Jumeaux Markdown

Pour chaque Article public (article de blog, guide, comparaison, histoire client, entrée de glossaire), émettez un jumeau Markdown au même chemin + suffixe `.md` :

| URL HTML                                         | Jumeau Markdown                                       |
| ------------------------------------------------ | --------------------------------------------------- |
| `/blog/inp-optimization-2026`                     | `/blog/inp-optimization-2026.md`                    |
| `/compare/ordiko-vs-shopify`                      | `/compare/ordiko-vs-shopify.md`                     |
| `/guides/migrate-from-shopify-to-ordiko`           | `/guides/migrate-from-shopify-to-ordiko.md`          |
| `/glossary/aeo`                                   | `/glossary/aeo.md`                                  |

Référencez la version Markdown dans votre HTML :

```html
<link rel="alternate" type="text/markdown" href="/blog/inp-optimization-2026/raw.md" />
```

La version Markdown doit contenir le même contenu que la page HTML, moins la navigation — juste le corps de l'article. Utilisez des titres, des listes, des tableaux et des blocs de code Markdown appropriés.

## Politique des robots d'IA dans robots.txt

Autorisez explicitement les moteurs que vous souhaitez voir cités :

```
User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: CCBot
Allow: /

# Refuser l'accès aux chemins privés/sensibles pour tous les robots
User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /api
Disallow: /admin
```

Les noms des agents utilisateurs :

| User-Agent          | Moteur             | Objectif                           |
| ------------------- | ------------------ | --------------------------------- |
| `GPTBot`            | OpenAI             | Collecte de données d'entraînement  |
| `ChatGPT-User`      | OpenAI             | Navigation ChatGPT à la demande de l'utilisateur |
| `OAI-SearchBot`     | OpenAI             | Index de recherche ChatGPT         |
| `ClaudeBot`         | Anthropic          | Récupération Claude.ai             |
| `anthropic-ai`      | Anthropic          | Collecte de données d'entraînement  |
| `PerplexityBot`     | Perplexity         | Index de Perplexity                |
| `Google-Extended`   | Google             | Opt-in pour l'entraînement Bard/Gemini |
| `CCBot`             | Common Crawl       | Ensemble de données ouvertes (utilisé par de nombreuses IA) |

## Modèles de contenu qui sont cités

Les moteurs d'IA analysent le contenu en tant que texte et préfèrent :

1. **Réponses définitoires directes dans les 60 premiers mots.** Commencez par la réponse.
2. **Questions H2, sous-questions H3.** Titres hiérarchiques = structure analysable.
3. **Tableaux Markdown pour des données comparables.** Les moteurs d'IA comprennent bien les tableaux.
4. **Statistiques numérotées avec année.** "En 2026, 73 % des commerçants..." est plus citables que "La plupart des commerçants...".
5. **Citez vos sources.** Incluez des liens `[Source](url)` — les moteurs d'IA pondèrent le contenu cité plus haut.
6. **Blocs FAQ.** Le format question-réponse est fortement favorisé par les systèmes de récupération.

Évitez :

- Les pyramides inversées (introduction, puis contexte, puis conclusion) — les moteurs d'IA citent souvent l'introduction et sautent le reste.
- Les longs paragraphes de texte sans structure.
- Le contenu caché "Cliquez pour développer" que les robots ne peuvent pas voir.
- Une forte dépendance aux images sans texte alternatif.

## Surveillance du trafic IA

Dans vos journaux de serveur, comptez les requêtes par agent utilisateur :

```bash
grep -oE "(GPTBot|ChatGPT-User|ClaudeBot|PerplexityBot)" access.log | sort | uniq -c
```

Vous devriez voir du trafic provenant de ces robots une fois qu'ils découvrent votre llms.txt. Le volume augmente au fil des semaines à mesure que les moteurs explorent et réexplorent.

Pour surveiller les citations :

- Recherchez le nom de votre marque sur Perplexity, ChatGPT, Claude, Gemini. Notez quelles pages sont citées.
- Utilisez des outils de surveillance de marque (Brand24, Mention) qui suivent de plus en plus les mentions d'IA.
- Mettez en place un examen trimestriel : interrogez "meilleure plateforme [votre catégorie]" sur chaque moteur d'IA et documentez qui est cité.

## Comment Ordiko gère l'AEO

Ordiko fournit :

- `/llms.txt` généré automatiquement par magasin et par apex.
- `/llms-full.txt` concaténant le corps Markdown complet de chaque document marketing.
- Jumeaux Markdown de chaque article de blog, guide, comparaison, histoire client, entrée de glossaire.
- Règles d'autorisation pour les robots d'IA sur les routes marketing ; interdiction sur le panier/checkout/compte.
- Modèles de contenu citables : introduction TL;DR, questions H2, tableaux, blocs FAQ, statistiques numérotées.

Aucune configuration requise.

## FAQ

**llms.txt est-il une norme officielle ?**
C'est une norme communautaire proposée par Jeremy Howard en 2024 et adoptée par Anthropic, Perplexity et d'autres. Il n'y a pas de spécification W3C ou IETF. Les moteurs d'IA le récupèrent opportunément lors de la découverte d'un domaine. Considérez-le comme une bonne pratique, pas une conformité stricte.

**llms.txt fera-t-il monter mon site dans les résultats de recherche Google ?**
Pas directement. Le SERP classique de Google ne lit pas llms.txt. Les avantages du signal concernent la citation dans la recherche IA (Perplexity, ChatGPT Search, Claude) et les aperçus IA de Google indirectement via des sémantiques de contenu plus claires.

**Dois-je bloquer les robots d'IA pour protéger mon contenu ?**
Pour la plupart des magasins de commerce électronique, non. Bloquer GPTBot/ClaudeBot/PerplexityBot de vos routes marketing garantit que vous ne serez pas cité lorsque les utilisateurs demandent aux moteurs d'IA à propos de votre catégorie. Le compromis est que les moteurs d'IA s'entraînent sur votre contenu ; pour le commerce électronique, c'est une fonctionnalité, pas un bug.

**Comment Ordiko gère-t-il llms.txt ?**
Ordiko génère automatiquement llms.txt et llms-full.txt par magasin à partir du catalogue et de la collection de contenu, avec invalidation du cache liée aux mutations de contenu. Les jumeaux Markdown sont émis à /blog/[slug].md, /compare/[slug].md, etc. La configuration est sans contact.