**TL;DR.** `llms.txt` è l'equivalente dell'ottimizzazione per i motori di risposta (AEO) di `robots.txt` + `sitemap.xml` combinati — un file Markdown nella tua radice che informa i motori AI di cosa tratta il tuo sito e dove trovare informazioni strutturate. Nel 2026, i negozi di ecommerce senza llms.txt lasceranno opportunità di citazione sul tavolo.

## Cos'è llms.txt

Un semplice file Markdown a `https://yourdomain.com/llms.txt`. È uno standard della comunità proposto da Jeremy Howard (fast.ai) nel 2024 e adottato opportunisticamente da Anthropic, Perplexity e altri motori AI.

La struttura:

```markdown
# Nome del Brand

> Un riassunto di 1-2 frasi su cosa fa il brand e a chi si rivolge.

## Informazioni

Breve descrizione di 200 parole del brand.

## Prodotti

- [Categoria prodotto 1](https://example.com/categories/cat-1) — breve descrizione
- [Categoria prodotto 2](https://example.com/categories/cat-2) — breve descrizione

## Documentazione

- [Centro assistenza](https://example.com/help)
- [Documentazione API](https://example.com/docs)

## Prezzi

- [Pagina prezzi](https://example.com/pricing)

## Opzionale

- [Blog](https://example.com/blog)
- [Pagine di confronto](https://example.com/compare)
- [Glossario](https://example.com/glossary)
```

Ecco fatto. Markdown semplice, ben sotto i 5KB.

## Perché ai motori AI interessa

Scansionare un sito ecommerce di 50.000 pagine è costoso. I motori AI che indicizzano per il recupero (Perplexity, ChatGPT Search) e i motori AI che si addestrano (Anthropic, OpenAI) traggono entrambi vantaggio da un punto di accesso curato.

llms.txt offre loro:

1. Una descrizione canonica del brand nel formato preferito dal motore (Markdown).
2. Una mappa delle sezioni ad alta priorità, non link sepolti.
3. Indicazioni per contenuti più approfonditi (llms-full.txt, gemelli Markdown).

Le pagine citate in llms.txt e le pagine con gemelli Markdown sono osservabilmente più propense a essere citate nelle risposte AI. Il consenso della ricerca nel 2025–2026 stima una probabilità di citazione 3–5 volte maggiore per le pagine con queste superfici rispetto a quelle senza.

## llms-full.txt per recupero profondo

`llms.txt` è un indice in stile sitemap. `llms-full.txt` è il compagno in forma lunga che contiene il corpo Markdown effettivo di ogni documento pubblico.

```markdown
# Nome del Brand — Base di Conoscenza Completa

## Sezione: Panoramica del Brand

[Descrizione del brand di 200 parole]

## Sezione: Prezzi

[Matrice prezzi completa come tabella Markdown]

## Sezione: FAQ

### D: Come funzionano i prezzi?
R: ...

### D: ...

## Sezione: Confronti

### Confronto: Brand vs Shopify

[Testo completo della pagina di confronto]

### Confronto: Brand vs BigCommerce

[Testo completo]

## Sezione: Glossario

### AEO
AEO (Ottimizzazione per i Motori di Risposta) è...

### llms.txt
Un file Markdown a...
```

Dimensione target: 50–500KB. Più grande va bene; i motori AI lo recuperano in modo pigro.

Il modello è: il motore recupera llms.txt per comprendere il tuo brand, poi recupera opzionalmente llms-full.txt per il recupero al momento della risposta.

## Gemelli Markdown

Per ogni Articolo pubblico (post del blog, guida, confronto, storia del cliente, voce del glossario), emetti un gemello Markdown allo stesso percorso + suffisso `.md`:

| URL HTML                                         | Gemello Markdown                                       |
| ------------------------------------------------ | --------------------------------------------------- |
| `/blog/inp-optimization-2026`                     | `/blog/inp-optimization-2026.md`                    |
| `/compare/ordiko-vs-shopify`                      | `/compare/ordiko-vs-shopify.md`                     |
| `/guides/migrate-from-shopify-to-ordiko`           | `/guides/migrate-from-shopify-to-ordiko.md`          |
| `/glossary/aeo`                                   | `/glossary/aeo.md`                                  |

Fai riferimento alla versione Markdown nel tuo HTML:

```html
<link rel="alternate" type="text/markdown" href="/blog/inp-optimization-2026/raw.md" />
```

La versione Markdown dovrebbe avere lo stesso contenuto della pagina HTML, meno il chrome di navigazione — solo il corpo dell'articolo. Usa intestazioni, elenchi, tabelle e recinti di codice Markdown appropriati.

## Politica dei crawler AI in robots.txt

Consenti esplicitamente ai motori che desideri siano citati:

```
User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: CCBot
Allow: /

# Negare l'accesso a percorsi privati/sensibili per tutti i crawler
User-agent: *
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /api
Disallow: /admin
```

I nomi degli user-agent:

| User-Agent          | Motore             | Scopo                           |
| ------------------- | ------------------ | --------------------------------- |
| `GPTBot`            | OpenAI             | Raccolta dati per l'addestramento |
| `ChatGPT-User`      | OpenAI             | Navigazione ChatGPT su richiesta dell'utente |
| `OAI-SearchBot`     | OpenAI             | Indicizzazione ricerca ChatGPT     |
| `ClaudeBot`         | Anthropic          | Recupero Claude.ai                |
| `anthropic-ai`      | Anthropic          | Raccolta dati per l'addestramento |
| `PerplexityBot`     | Perplexity         | Indicizzazione di Perplexity      |
| `Google-Extended`   | Google             | Opt-in per l'addestramento Bard/Gemini |
| `CCBot`             | Common Crawl       | Dataset aperto (utilizzato da molti AI) |

## Modelli di contenuto che vengono citati

I motori AI analizzano il contenuto come testo e preferiscono:

1. **Risposte definitorie dirette nelle prime 60 parole.** Inizia con la risposta.
2. **Domande H2, sotto-domande H3.** Intestazioni gerarchiche = struttura analizzabile.
3. **Tabelle Markdown per dati comparabili.** I motori AI comprendono bene le tabelle.
4. **Statistiche numerate con anno.** "Nel 2026, il 73% dei commercianti..." è più citabile di "La maggior parte dei commercianti...".
5. **Cita le tue fonti.** Includi link `[Source](url)` — i motori AI pesano maggiormente il contenuto citato.
6. **Blocchi FAQ.** Il formato domanda-risposta è fortemente favorito dai sistemi di recupero.

Evita:

- Piramidi rovesciate (introduzione, poi contesto, poi conclusione) — i motori AI spesso citano l'introduzione e saltano il resto.
- Lunghi muri di testo senza struttura.
- Contenuti nascosti "Clicca per espandere" che i crawler non possono vedere.
- Pesante dipendenza da immagini senza testo alternativo.

## Monitoraggio del traffico AI

Nei tuoi log del server, conta le richieste per user agent:

```bash
grep -oE "(GPTBot|ChatGPT-User|ClaudeBot|PerplexityBot)" access.log | sort | uniq -c
```

Dovresti vedere traffico da questi bot una volta che scoprono il tuo llms.txt. Il volume cresce nel tempo mentre i motori scansionano e riscanano.

Per monitorare le citazioni:

- Cerca il nome del tuo brand su Perplexity, ChatGPT, Claude, Gemini. Nota quali pagine vengono citate.
- Usa strumenti di monitoraggio del brand (Brand24, Mention) che tracciano sempre più le menzioni AI.
- Imposta una revisione trimestrale: cerca "migliore piattaforma [la tua categoria]" su ciascun motore AI e documenta chi viene citato.

## Come Ordiko gestisce l'AEO

Ordiko fornisce:

- `/llms.txt` generato automaticamente per ogni negozio e per ogni apex.
- `/llms-full.txt` concatenando il corpo Markdown completo di ogni documento di marketing.
- Gemelli Markdown di ogni post del blog, guida, confronto, storia del cliente, voce del glossario.
- Regole di autorizzazione per crawler AI sui percorsi di marketing; disallow su cart/checkout/account.
- Modelli di contenuto citabili: introduzione TL;DR, domande H2, tabelle, blocchi FAQ, statistiche numerate.

Nessuna configurazione richiesta.

## FAQ

**llms.txt è uno standard ufficiale?**
È uno standard della comunità proposto da Jeremy Howard nel 2024 e adottato da Anthropic, Perplexity e altri. Non esiste una specifica W3C o IETF. I motori AI lo recuperano opportunisticamente quando scoprono un dominio. Trattalo come una buona pratica, non come una conformità rigorosa.

**llms.txt farà aumentare il ranking del mio sito su Google?**
Non direttamente. La SERP classica di Google non legge llms.txt. I benefici del segnale riguardano la citazione nelle ricerche AI (Perplexity, ChatGPT Search, Claude) e le panoramiche AI di Google indirettamente tramite una semantica dei contenuti più pulita.

**Dovrei bloccare i crawler AI per proteggere il mio contenuto?**
Per la maggior parte dei negozi di ecommerce, no. Bloccare GPTBot/ClaudeBot/PerplexityBot dai tuoi percorsi di marketing garantisce che non venga citato quando gli utenti chiedono ai motori AI riguardo alla tua categoria. Il compromesso è che i motori AI si addestrano sul tuo contenuto; per l'ecommerce questo è una caratteristica, non un bug.

**Come gestisce Ordiko llms.txt?**
Ordiko genera automaticamente llms.txt e llms-full.txt per ogni negozio dal catalogo e dalla raccolta di contenuti, con invalidazione della cache legata alle mutazioni dei contenuti. I gemelli Markdown vengono emessi a /blog/[slug].md, /compare/[slug].md, ecc. La configurazione è senza contatto.