llms.txt: què és i per què la IA encara no el llegeix

llms.txt és un arxiu de text que col·loques a l'arrel del teu web per donar als models d'IA un resum net i ordenat del teu contingut. La proposta és assenyada. El problema és que, ara mateix, els grans motors d'IA gairebé no el llegeixen: en l'experiment més rigorós fins a la data —90 dies i més de 62.000 visites de bots d'IA a un mateix lloc—, només el 0,1% d'aquelles visites va anar al dichós arxiu. Si el teu pla perquè ChatGPT et recomani passa per posar un llms.txt, les dades diuen que estàs optimitzant per a un lector que no apareix.

I tot i així, gairebé tot el que s'ha escrit sobre això —en castellà, desenes de guies d'agències i de les grans suites de SEO— ho ven com la nova peça imprescindible per a la visibilitat a la IA. Mirem les dades, que és el que gairebé ningú ha fet.

Què és llms.txt?

llms.txt és un arxiu en format Markdown, allotjat a eldomini.com/llms.txt, que ofereix als models de llenguatge una versió curada i sense soroll del teu lloc: un resum de qui ets i enllaços als teus continguts més importants en text net. El va proposar Jeremy Howard, fundador d'Answer.AI, el setembre de 2024.

El problema que diu resoldre és real. Un web modern està ple de menús, banners de cookies, scripts i peus de pàgina que per a un humà són interfície, però per a un model que llegeix la pàgina són soroll que costa tokens i entorpeix la comprensió. La idea del llms.txt és lliurar a la màquina el contingut ja destil·lat, sense que hagi d'escarbar.

El sector l'ha batejat de mil formes —el "sitemap de la IA", el "menú degustació", la "carpeta de premsa per a la IA"—. Totes aquestes metàfores comparteixen un supòsit que convé posar sobre la taula abans de continuar: que hi ha un model a l'altra banda llegint l'arxiu. Aquí és on la cosa cau.

La IA llegeix el teu llms.txt?

Ara mateix, no de manera significativa. Cap gran proveïdor d'IA ha confirmat que els seus sistemes en producció facin servir el teu llms.txt per descobrir-te, citar-te o recomanar-te, i els registres de servidor —que és on es veu la veritat— ho confirmen.

La dada més sòlida la va publicar OtterlyAI, una eina de mesura de visibilitat a la IA, després d'un experiment de 90 dies. Van posar un llms.txt a l'arrel d'un lloc i van mesurar què feien els bots d'IA. De més de 62.000 visites de bots d'IA al lloc, només 84 van anar a l'arxiu: un 0,1%. Per posar-ho en context, una pàgina normal d'aquell mateix lloc va rebre de mitjana unes 265 visites de bots. El llms.txt va rendir tres vegades pitjor que una pàgina qualsevol, i tot just millor que un PDF perdut. En el seu propi resum: per als bots, el llms.txt és gairebé invisible.

No és un cas aïllat. Una auditoria independent de trenta dies sobre mil dominis va trobar que ni un sol bot d'IA —ni el d'OpenAI, ni el d'Anthropic, ni el de Perplexity— va passar a recollir l'arxiu; l'únic que el tocava era el rastrejador normal de Google, aquell que demana tot el que troba. Search Engine Land va fer l'experiment sobre el seu propi web durant tres mesos i va registrar zero visites dels crawlers d'IA, sense cap millora mesurable en la seva presència dins de les respostes generatives. I Ahrefs ho va tancar sense anestèsia: no hi ha ni una prova que cap model faci servir aquest arxiu per decidir a qui resumeix o cita.

Google ha estat el més explícit. Ha dit que els seus sistemes de cerca no llegeixen ni actuen sobre el llms.txt, i ha arribat a comparar-lo amb el meta tag "keywords" —aquella etiqueta que els SEO omplien religiosament fa quinze anys i que els cercadors van acabar ignorant del tot—. L'analogia fa mal perquè és precisa.

Per què no funciona com et penses?

Perquè el llms.txt no té ningú obligat a llegir-lo, i perquè la IA no es forma la seva opinió de tu llegint el que tu dius de tu.

La trampa és en l'analogia amb el robots.txt. El raonament del sector va així: el robots.txt controla els rastrejadors, el sitemap ajuda que et descobreixin, doncs el llms.txt millorarà el meu lloc a les respostes d'IA. Sona lògic i és fals. El robots.txt funciona per un motiu que el llms.txt no té: fa vint anys els cercadors van acordar respectar-lo. Hi ha un pacte, hi ha algú a l'altra banda fent-te cas. El llms.txt és un cartell que penges a l'aparador adreçat a un client que no passa pel teu carrer. Tant se val com de ben redactat estigui.

Hi ha una raó de fons, i és la que vam mesurar al nostre estudi La cuota invisible. Quan un autònom pregunta a ChatGPT quin programari de facturació fer servir, el model no consulta l'arxiu que tu li vas deixar a la porta. Recorre les associacions que ha construït, a base de llegir mitja internet, entre la intenció d'aquella persona i les marques que apareixen una vegada i una altra lligades a aquella intenció. El teu lloc en aquella xarxa mental del model no el decideixes declarant-te en un .txt. El decideix el teu rastre: quant i com et nomena la resta de la web. Per això un arxiu a la teva arrel no mou l'agulla. No està mal fet; està apuntant al lloc equivocat.

Els grans motors —Google, Perplexity, OpenAI— ja tenen màquines caríssimes dedicades a netejar HTML, identificar el contingut principal i rankejar-lo. No necessiten que els deixis un resum per entendre la teva pàgina. Fa anys que inverteixen a fer això sols, a escala. El llms.txt els resol un problema que ells ja tenien resolt.

Per a què serveix llms.txt de debò?

Serveix perquè les eines d'IA que integren el teu contingut —i que no tenen la infraestructura de Google— el consumeixin més barat i més net. Aquest és l'ús per al qual es va dissenyar, i aquí sí que funciona.

Pensa en un assistent de programació com Cursor o Copilot, o en un copilot ficat dins d'un SaaS, o en un bot de suport que tira de la teva documentació. Aquestes eines, quan necessiten una pàgina teva, l'han de demanar i netejar al vol, cosa que és cara i farragosa: trucar a l'API de cerca d'un gran proveïdor pot costar entre 10 i 14 dòlars per cada mil consultes, i això es dispara a escala. Un llms.txt ben fet els lliura el teu contingut ja en Markdown net, sense banners ni morralla, gastant una fracció dels tokens. Per a aquell cas és una cortesia tècnica que millora la velocitat, el cost i fins i tot la qualitat de la resposta.

Per això les mateixes empreses d'IA —OpenAI, Anthropic, Perplexity, Stripe— publiquen el seu llms.txt: perquè els assistents de codi consumeixin la seva documentació. I aquí hi ha el malentès que mou tot el mercat. Algú veu que Anthropic té un llms.txt i conclou "necessito un perquè la IA em citi". Però que una empresa publiqui un manual net perquè les màquines el llegeixin no té res a veure amb que el rastrejador d'aquella empresa passi pel teu web a llegir el teu per recomanar-te. És confondre posar el manual d'instruccions en una prestatgeria accessible amb tenir una tanca publicitària. Són coses diferents que no es toquen.

Hauries de posar un llms.txt?

Si el teu objectiu és la visibilitat a la IA, posar-lo no et farà mal, però no esperis que mogui res a curt termini. Si tens documentació tècnica o una API que altres integren a les seves pròpies eines, aleshores sí que té sentit i és una aposta de futur raonable.

Implementar-lo costa deu minuts i hi ha plugins que el generen sols, així que com a assegurança de cara al dia en què això canviï, endavant. Fins i tot el mateix Jeremy Howard reconeix que l'estàndard està a les beceroles i prediu que algun dia emergirà un protocol formal de rastreig per a IA, potser hereu d'aquest. Curar-se en salut és legítim.

Dos avisos abans. El primer: ni se t'acudeixi publicar la versió completa, el llms-full.txt, que aboca tot el teu contingut en un únic arxiu. Això és servir als teus competidors i a qualsevol rastrejador la teva biblioteca sencera en text net i fàcil de copiar. La transparència està bé; regalar la feina d'anys, no.

El segon és el que importa. No fiquis el llms.txt a la casella d'"estratègia de visibilitat a la IA", perquè allà no hi pinta res, i el pressupost que li dediquis pensant que aquesta és la feina és pressupost llançat. La feina de debò és en una altra banda: que la IA et tingui construït com una entitat nítida —que sàpiga amb precisió què ets i per a qui—, i que el teu rastre estigui densament lligat a les intencions que et donen de menjar, a les fonts que el model llegeix de debò. Això és lent, car i difícil de falsificar. Per això gairebé ningú ho fa, i per això funciona. El llms.txt és just el contrari: fàcil, gratis, i amb la sensació reconfortant d'haver fet alguna cosa. El que és barat de fer sol ser barat d'ignorar, i això és exactament el que els models estan fent amb ell.

Fins i tot OtterlyAI, que ven eines de GEO, ha tret el comprovador de llms.txt de la seva auditoria, perquè el seu impacte real en com et descobreix la IA és marginal i distreu del que de debò mou la visibilitat.

llms.txt vs robots.txt vs sitemap.xml

Els tres són arxius a l'arrel del teu domini i aquí s'acaba la semblança. El robots.txt és control d'accés: diu als rastrejadors on no poden entrar, i funciona perquè els cercadors van acordar obeir-lo. El sitemap.xml és inventari: llista totes les teves URLs perquè els cercadors les descobreixin i rastregin amb eficiència. El llms.txt és una proposta d'orientació: pretén assenyalar als models d'IA quins són els teus continguts més rellevants. La diferència decisiva és que els dos primers tenen destinataris que els respecten des de fa anys, i el tercer, de moment, no.

Preguntes freqüents sobre llms.txt

La IA llegeix l'arxiu llms.txt? Ara mateix, gairebé no. En l'experiment més ampli disponible, només el 0,1% de les visites de bots d'IA va anar a l'arxiu, i Google ha confirmat que no el fa servir a les seves funcions d'IA.

El llms.txt millora el meu posicionament o les meves citacions a la IA? No hi ha evidència que ho faci. Cap gran motor d'IA el fa servir per rankejar o citar, i els estudis de logs no troben correlació entre tenir-lo i aparèixer més a les respostes generatives.

Aleshores, per a què serveix llms.txt? Perquè les eines d'IA que integren contingut —assistents de codi, copilots, bots de suport— consumeixin el teu lloc de manera més neta i barata. És infraestructura per a integracions, no una palanca de visibilitat.

Hauria d'implementar llms.txt? Si tens documentació o APIs que altres integren, sí, com a aposta de futur de baix cost. Si el teu objectiu és que la IA et recomani als teus clients, el teu esforç rendeix més en contingut, entitat i citacions per la web.

Què és el llms-full.txt i l'he de fer servir? És una versió que aboca tot el teu contingut en un sol arxiu. No és recomanable: equival a lliurar la teva biblioteca completa a competidors i rastrejadors en text fàcil de copiar.

És el mateix llms.txt que robots.txt? No. El robots.txt controla l'accés dels rastrejadors i es respecta des de fa anys; el llms.txt és una proposta d'orientació per a models d'IA que, de moment, aquests models no llegeixen de manera significativa.

Anàlisi d'Elevam Labs. Si vols entendre on es decideix de debò que la IA et recomani —i no en un arxiu de la teva arrel—, és al nostre estudi La cuota invisible.

Per

Asier López Ruiz

20 de juny del 2026 · 10 min

Tornar al blog

GEO

Más artículos relacionados

Ver todos →

La quota invisible — estudi d'Elevam Labs sobre a qui recomana la IA quan pregunten pel teu sector

GEO18 de juny del 2026

La quota invisible: a qui recomana la IA

5 motors d'IA, programari de facturació, sense anomenar marques: el 55% de la recomanació va a marques que no tenies fitxades. La IA reparteix quota de graf.

Per asier-lopez15 min

Auditoria GEO — portada de l'article d'Elevam sobre com mesurar la visibilitat en IA.

GEO3 de juny del 2026

Auditoria GEO: la guia definitiva per mesurar la teva visibilitat en IA

Què és una auditoria GEO i com es mesura la visibilitat en IA (ChatGPT, Gemini, Perplexity, Claude i AI Overview): metodologia, mètriques que saps calcular, errors habituals i el pas a pas real amb Antropus.

Per asier-lopez38 min

T'estan venent GEO a cegues — Elevam Labs sobre el buit d'evidència en castellà

GEO26 de maig del 2026

T'estan venent GEO a cegues: zero estudis seriosos en castellà

Fishkin, Ahrefs, Profound, Princeton-KDD: tot el rigor publicat sobre visibilitat en motors d'IA està en anglès. En castellà, zero. El sector està aplicant un manual d'una altra ciutat. Per què importa, què diu Akerlof sobre el mercat de llimones, i què està mesurant Elevam Labs.

Per asier-lopez10 min