llms.txt: Il Protocollo Che Vuole Parlare con l’AI (Ma l’AI Non Sta Ascoltando) | Aidentity

Nel mondo della Generative Engine Optimization sta emergendo un file che ricorda i primi giorni del robots.txt: si chiama llms.txt. La promessa è semplice — dare all’intelligenza artificiale una mappa pulita del tuo sito, senza dover scavare nell’HTML. La realtà, però, è più complicata di quello che la maggior parte dei consulenti GEO ti racconta.

Cos’è llms.txt e chi l’ha inventato

Il protocollo llms.txt è stato proposto a settembre 2024 da Jeremy Howard, co-fondatore di fast.ai e Answer.AI, ricercatore e docente alle università di Queensland e Stanford (Towards Data Science, gennaio 2025). Howard è una figura di peso nel deep learning: il suo lavoro su ULMFiT ha contribuito a gettare le basi per i moderni Large Language Model.
L’idea nasce da un problema tecnico reale. I modelli AI hanno finestre di contesto limitate — la quantità di testo che possono elaborare in una singola sessione. Quando un LLM tenta di leggere una pagina web, gran parte dello spazio viene consumato da markup HTML, CSS, JavaScript, menu di navigazione e banner pubblicitari. Il contenuto utile si perde nel rumore.
llms.txt propone una soluzione: un file markdown nella root del sito (come robots.txt) che fornisce ai modelli AI una mappa strutturata dei contenuti più importanti, in formato pulito e leggibile. La specifica prevede due file:

  • /llms.txt — Una vista sintetica della struttura del sito, con link alle pagine principali organizzate per sezione
  • /llms-full.txt — Un documento completo con tutto il contenuto in un unico file markdown, pensato per l’ingestione diretta da parte dei modelli AI

Il formato è volutamente semplice: un titolo H1 con il nome del progetto, un blocco citazione con il sommario, e sezioni H2 che organizzano i link alla documentazione.

Chi lo sta adottando

A luglio 2025, più di 600 siti web hanno implementato llms.txt (Peec AI, 2025). Tra i nomi di peso:

  • Anthropic — Il creatore di Claude ha implementato un llms.txt completo per la documentazione API e le librerie di prompt. Anzi, Anthropic ha specificamente chiesto a Mintlify (la piattaforma di documentazione) di sviluppare il supporto per llms-full.txt (Mintlify, maggio 2025)
  • Perplexity — Ha creato file di documentazione dettagliati per la propria piattaforma AI, con un llms-full.txt di oltre 7.000 righe e 30.000 parole
  • Google — Ha incluso un file llms.txt nel proprio protocollo Agent-to-Agent (A2A) (Mintlify, 2025)
  • Cloudflare — Ha organizzato la documentazione multi-servizio per area
  • Stripe, Cursor, Hugging Face, Zapier, ElevenLabs, Solana, Raycast, Yoast, DataForSEO — Tutti hanno implementato il protocollo

A giugno 2025, anche Yoast SEO ha aggiunto il supporto nativo per la generazione di llms.txt direttamente dalla dashboard WordPress, sia nella versione free che premium (Seahawk Media, luglio 2025).

Il Dato reale: non funziona (per ora)

Ed ecco dove la narrazione si scontra con i dati.
SE Ranking ha condotto lo studio più ampio finora disponibile: un’analisi su 300.000 domini per verificare se llms.txt ha un impatto misurabile sulle citazioni AI (SE Ranking, novembre 2025).
I risultati:

  • Il file llms.txt è presente solo sul 10,13% dei domini analizzati — quasi 9 siti su 10 non lo hanno
  • L’adozione è sorprendentemente uniforme: 9,88% tra i siti con poco traffico, 10,54% tra quelli medi, 8,27% tra quelli con più di 100.000 visite. Non sono i big player a guidare l’adozione
  • Nessuna correlazione statisticamente significativa tra la presenza di llms.txt e la frequenza di citazione da parte dei modelli AI
  • Nei test di machine learning, rimuovere la variabile llms.txt ha effettivamente migliorato l’accuratezza del modello predittivo

Tradotto: llms.txt non solo non aiuta — nel modello predittivo, è rumore.
John Mueller di Google lo ha confermato a metà 2025: nessun sistema AI di Google utilizza llms.txt come segnale (Search Signal, 2026). Le AI Overviews e AI Mode si basano sulla stessa infrastruttura di crawling e indicizzazione della ricerca tradizionale. Un file di testo nella root directory non cambia come quel contenuto viene recuperato, classificato o citato.
Anche lato OpenAI, la documentazione del crawler si concentra sui controlli robots.txt. OpenAI raccomanda di permettere a OAI-SearchBot l’accesso tramite robots.txt, ma non c’è alcuna conferma che llms.txt influenzi il ranking o le citazioni di ChatGPT (Search Engine Journal, novembre 2025).

Allora perché se ne parla tanto?

Perché l’idea ha senso in teoria, e perché il marketing ha bisogno di soluzioni semplici da vendere.
Il protocollo ha alcune applicazioni legittime e concrete:

  • Documentazione tecnica e API — Per chi sviluppa tool, SaaS o piattaforme con documentazione complessa, llms.txt aiuta effettivamente gli agenti AI a navigare la struttura del sito. Aziende come Cursor e Windsurf riportano risparmio di token e tempo quando gli agenti non devono parsare HTML complesso
  • Agenti AI interni — Le aziende che costruiscono agenti AI per automazione del supporto o knowledge retrieval usano llms.txt come “loader di contesto strutturato” — l’agente legge prima llms.txt, capisce la struttura, poi scarica le pagine specifiche
  • Preparazione futura — Il protocollo potrebbe guadagnare supporto ufficiale. I bot LLM effettivamente accedono ai file llms.txt e llms-full.txt (dati Mintlify/Profound, 2025), anche se questo non si traduce ancora in citazioni

Ma come strategia GEO per ottenere più citazioni nelle risposte AI? I dati dicono di no.

Cosa funziona davvero per le citazioni AI

Lo stesso studio SE Ranking su 300.000 domini (più un’analisi separata su 129.000 domini e 216.524 pagine) ha identificato cosa conta effettivamente per essere citati da ChatGPT e dagli altri modelli:

  • Domain authority e referring domains — I siti con oltre 32.000 domini referenti hanno 3,5 volte più probabilità di essere citati da ChatGPT rispetto a quelli con meno di 200 (SE Ranking, novembre 2025)
  • Presenza su Quora e Reddit — I domini con milioni di menzioni su queste piattaforme hanno circa 4 volte più probabilità di essere citati (SE Ranking, novembre 2025)
  • Profili su piattaforme di recensione — I domini con profili su Trustpilot, G2, Capterra, Sitejabber e Yelp hanno 3 volte più probabilità di essere scelti come fonte da ChatGPT (SE Ranking, novembre 2025)
  • Velocità di caricamento — Le pagine con First Contentful Paint sotto 0,4 secondi ottengono in media 6,7 citazioni, contro le 2,1 delle pagine più lente (oltre 1,13 secondi). 3 volte di più (SE Ranking, novembre 2025)
  • Contenuti lunghi e strutturati — Articoli sopra le 2.900 parole ottengono in media 5,1 citazioni, contro le 3,2 di quelli sotto le 800. Sezioni di 120-180 parole tra un heading e l’altro ricevono il 70% in più di citazioni rispetto a sezioni sotto le 50 parole (SE Ranking, novembre 2025)
  • Freschezza — Contenuti aggiornati negli ultimi 3 mesi ottengono in media 6 citazioni, contro le 3,6 dei contenuti datati (SE Ranking, novembre 2025)
  • Heading con domande e sezioni FAQ — Aumentano la probabilità di citazione. Lo schema markup FAQ, invece, non è essenziale (SE Ranking, novembre 2025)

I Plugin WordPress per llms.txt: Cosa esiste

Se vuoi comunque implementare llms.txt (la logica del “costa poco, potrebbe servire in futuro” ha senso), esistono diversi plugin WordPress:

  • GEO Advanced— Il più potente d tutti, ha una serie di funzioni imperdibili tra cui la verifica della freshness fondamentle per le AI platform
  • Geo Optimizer — genera automaticamente il file llms.txt, è un ottimizzatore completo automatizzato. Va bene per chi non vuole perdere tempo per il setting
  • GEO Refresh — Plugin superlativo per rinfrescare i contenuti del sito e soprattutto blog, analizza l’intero sito e ti dice dove sei perdente, L’audit AI è stupefcente, èm capace di generare contenuti mediante prompt da far girare su qualsiasi AI. Fornisce le FAQ semplicemente da aggiungere e successivamente ti aggiorna lo schema. TOP.
  • Yoast SEO — Da giugno 2025, supporto nativo per llms.txt sia nella versione free che premium
  • All in One SEO (AIOSEO) — Generazione llms.txt automatica con logica di priorità integrata

La nostra posizione

llms.txt è un protocollo con un fondamento tecnico solido, creato da una delle menti più rispettate nel deep learning. L’idea che i siti web debbano avere un “volto leggibile dalle macchine” oltre a quello leggibile dagli umani è corretta e lungimirante.
Ma oggi, a febbraio 2026, implementare llms.txt come strategia principale di visibilità AI è un errore. I dati su 300.000 domini sono chiari: non c’è impatto misurabile.
Quello che funziona è quello che ha sempre funzionato, potenziato e adattato per l’era AI: contenuti profondi, autorevoli e aggiornati; struttura pulita e leggibile; velocità tecnica; presenza cross-piattaforma; e una strategia di entity building che faccia riconoscere il tuo brand come fonte affidabile dai modelli AI.
llms.txt? Implementalo. Costa cinque minuti. Ma non confonderlo con una strategia GEO.

Per quella bisogna aspettare che si manifestino le regole del gioco, molte le implementiamo da soli, visita la suite e capirai il perchè.

FAQ

llms.txt è come robots.txt?

No. robots.txt dice ai crawler cosa possono o non possono scansionare — è un meccanismo di controllo degli accessi. llms.txt è un meccanismo di facilitazione: suggerisce ai modelli AI quali contenuti sono più importanti e li presenta in formato strutturato. Non ha alcun potere di blocco o restrizione. Sono complementari, non alternativi.

Devo implementare llms.txt sul mio sito?

Se hai documentazione tecnica, API o un prodotto SaaS, sì — ha utilità concreta per gli agenti AI. Per un sito aziendale o un blog, è un investimento da cinque minuti che non farà danni, ma non aspettarti un impatto sulle citazioni AI. I fattori che contano davvero sono domain authority, velocità del sito, freschezza dei contenuti e presenza su piattaforme terze.

I motori AI leggono effettivamente il file llms.txt?

I dati di Mintlify/Profound mostrano che alcuni bot LLM accedono effettivamente a llms.txt e llms-full.txt. Tuttavia, John Mueller di Google ha confermato che nessun sistema AI di Google lo utilizza come segnale. OpenAI non ha indicato alcun impatto sul ranking. C’è accesso, ma non c’è correlazione con le citazioni.

Quale plugin WordPress devo usare per llms.txt?

Se usi già Yoast SEO, il supporto è integrato da giugno 2025. Per funzionalità più avanzate come il tracking dei bot AI e analytics dedicati, LLMagnet e GEO Pilot offrono strumenti specifici. GEO for AI Lite è gratuito e include un audit completo a 22 fattori.

llms.txt diventerà uno standard ufficiale?

Troppo presto per dirlo. Ha grassroots adoption significativa (600+ siti, inclusi Anthropic, Google, Perplexity), integrazione nelle piattaforme di documentazione, e tool dedicati. Ma nessun provider AI ha annunciato supporto ufficiale. Il pattern ricorda l’evoluzione di altri standard web: adozione dal basso, integrazione nelle piattaforme, momentum della community, poi eventuale riconoscimento ufficiale. Potrebbe seguire questa traiettoria, oppure restare una soluzione transitoria.

FONTI:

Jeremy Howard / Answer.AI (settembre 2024) — Proposta originale del protocollo llms.txt
Towards Data Science (gennaio 2025) — LLMs.txt Explained
SE Ranking (novembre 2025) — Studio su 300.000 domini: “LLMs.txt: Why Brands Rely On It and Why It Doesn’t Work”
SE Ranking (dicembre 2025) — Studio su 129.000 domini e 216.524 pagine: fattori di citazione ChatGPT
Mintlify (maggio 2025) — “The value of llms.txt: Hype or real?”
Peec AI (luglio 2025) — Dati di adozione e crawling
Search Engine Journal (novembre 2025) — “LLMs.txt Shows No Clear Effect On AI Citations”
John Mueller / Google (2025) — Dichiarazioni su llms.txt e AI Overviews
Seahawk Media (luglio 2025) — Yoast SEO llms.txt support

Aidentity è specializzata in strategie di posizionamento per l’era dell’intelligenza artificiale. Non vendiamo scorciatoie — costruiamo visibilità reale, basata su dati e risultati misurabili.