Saltar al contenido
GEO10 min

llms.txt: qué es y por qué la IA todavía no lo lee

Qué es llms.txt, para qué sirve y si mejora tu visibilidad en IA. Los datos dicen que los motores de IA apenas lo leen: análisis de Elevam con evidencia 2026.

llms.txt es un archivo de texto que colocas en la raíz de tu web para darle a los modelos de IA un resumen limpio y ordenado de tu contenido. La propuesta es sensata. El problema es que, a día de hoy, los grandes motores de IA apenas lo leen: en el experimento más riguroso hasta la fecha —90 días y más de 62.000 visitas de bots de IA a un mismo sitio—, solo el 0,1% de esas visitas fue al dichoso archivo. Si tu plan para que ChatGPT te recomiende pasa por poner un llms.txt, los datos dicen que estás optimizando para un lector que no aparece.

Y aun así, casi todo lo que se ha escrito sobre esto —en español, decenas de guías de agencias y de las grandes suites de SEO— lo vende como la nueva pieza imprescindible para la visibilidad en IA. Vamos a mirar los datos, que es lo que casi nadie ha hecho.

¿Qué es llms.txt?

llms.txt es un archivo en formato Markdown, alojado en tudominio.com/llms.txt, que ofrece a los modelos de lenguaje una versión curada y sin ruido de tu sitio: un resumen de qué eres y enlaces a tus contenidos más importantes en texto limpio. Lo propuso Jeremy Howard, fundador de Answer.AI, en septiembre de 2024.

El problema que dice resolver es real. Una web moderna está llena de menús, banners de cookies, scripts y pies de página que para un humano son interfaz, pero para un modelo que lee la página son ruido que cuesta tokens y entorpece la comprensión. La idea del llms.txt es entregarle a la máquina el contenido ya destilado, sin que tenga que escarbar.

El sector lo ha bautizado de mil formas —el "sitemap de la IA", el "menú degustación", la "carpeta de prensa para la IA"—. Todas esas metáforas comparten un supuesto que conviene poner sobre la mesa antes de seguir: que hay un modelo al otro lado leyendo el archivo. Ahí es donde la cosa se cae.

¿La IA lee tu llms.txt?

A día de hoy, no de forma significativa. Ningún gran proveedor de IA ha confirmado que sus sistemas en producción usen tu llms.txt para descubrirte, citarte o recomendarte, y los registros de servidor —que es donde se ve la verdad— lo confirman.

El dato más sólido lo publicó OtterlyAI, una herramienta de medición de visibilidad en IA, tras un experimento de 90 días. Pusieron un llms.txt en la raíz de un sitio y midieron qué hacían los bots de IA. De más de 62.000 visitas de bots de IA al sitio, solo 84 fueron al archivo: un 0,1%. Para ponerlo en contexto, una página normal de ese mismo sitio recibió de media unas 265 visitas de bots. El llms.txt rindió tres veces peor que una página cualquiera, y apenas mejor que un PDF perdido. En su propio resumen: para los bots, el llms.txt es casi invisible.

No es un caso aislado. Una auditoría independiente de treinta días sobre mil dominios encontró que ni un solo bot de IA —ni el de OpenAI, ni el de Anthropic, ni el de Perplexity— pasó a recoger el archivo; el único que lo tocaba era el rastreador normal de Google, ese que pide todo lo que encuentra. Search Engine Land hizo el experimento sobre su propia web durante tres meses y registró cero visitas de los crawlers de IA, sin ninguna mejora medible en su presencia dentro de las respuestas generativas. Y Ahrefs lo zanjó sin anestesia: no hay ni una prueba de que ningún modelo use ese archivo para decidir a quién resume o cita.

Google ha sido el más explícito. Ha dicho que sus sistemas de búsqueda no leen ni actúan sobre el llms.txt, y ha llegado a compararlo con el meta tag "keywords" —esa etiqueta que los SEO rellenaban religiosamente hace quince años y que los buscadores acabaron ignorando del todo—. La analogía duele porque es precisa.

¿Por qué no funciona como crees?

Porque el llms.txt no tiene a nadie obligado a leerlo, y porque la IA no se forma su opinión de ti leyendo lo que tú dices de ti.

La trampa está en la analogía con el robots.txt. El razonamiento del sector va así: el robots.txt controla a los rastreadores, el sitemap ayuda a que te descubran, luego el llms.txt mejorará mi sitio en las respuestas de IA. Suena lógico y es falso. El robots.txt funciona por un motivo que el llms.txt no tiene: hace veinte años los buscadores acordaron respetarlo. Hay un pacto, hay alguien al otro lado haciéndote caso. El llms.txt es un cartel que cuelgas en tu escaparate dirigido a un cliente que no pasa por tu calle. Da igual lo bien redactado que esté.

Hay una razón de fondo, y es la que medimos en nuestro estudio La cuota invisible. Cuando un autónomo le pregunta a ChatGPT qué software de facturación usar, el modelo no consulta el archivo que tú le dejaste en la puerta. Recorre las asociaciones que ha construido, a base de leer media internet, entre la intención de esa persona y las marcas que aparecen una y otra vez ligadas a esa intención. Tu sitio en esa red mental del modelo no lo decides declarándote en un .txt. Lo decide tu rastro: cuánto y cómo te nombra el resto de la web. Por eso un archivo en tu raíz no mueve la aguja. No está mal hecho; está apuntando al sitio equivocado.

Los grandes motores —Google, Perplexity, OpenAI— ya tienen máquinas carísimas dedicadas a limpiar HTML, identificar el contenido principal y rankearlo. No necesitan que les dejes un resumen para entender tu página. Llevan años invirtiendo en hacer eso solos, a escala. El llms.txt les resuelve un problema que ellos ya tenían resuelto.

¿Para qué sirve llms.txt de verdad?

Sirve para que las herramientas de IA que integran tu contenido —y que no tienen la infraestructura de Google— lo consuman más barato y más limpio. Ese es el uso para el que se diseñó, y ahí sí funciona.

Piensa en un asistente de programación como Cursor o Copilot, o en un copiloto metido dentro de un SaaS, o en un bot de soporte que tira de tu documentación. Esas herramientas, cuando necesitan una página tuya, tienen que pedirla y limpiarla al vuelo, lo cual es caro y farragoso: llamar a la API de búsqueda de un gran proveedor puede costar entre 10 y 14 dólares por cada mil consultas, y eso se dispara a escala. Un llms.txt bien hecho les entrega tu contenido ya en Markdown limpio, sin banners ni morralla, gastando una fracción de los tokens. Para ese caso es una cortesía técnica que mejora la velocidad, el coste y hasta la calidad de la respuesta.

Por eso las propias empresas de IA —OpenAI, Anthropic, Perplexity, Stripe— publican su llms.txt: para que los asistentes de código consuman su documentación. Y aquí está el malentendido que mueve a todo el mercado. Alguien ve que Anthropic tiene un llms.txt y concluye "necesito uno para que la IA me cite". Pero que una empresa publique un manual limpio para que las máquinas lo lean no tiene nada que ver con que el rastreador de esa empresa pase por tu web a leer el tuyo para recomendarte. Es confundir poner el manual de instrucciones en una estantería accesible con tener una valla publicitaria. Son cosas distintas que no se tocan.

¿Deberías poner un llms.txt?

Si tu objetivo es la visibilidad en IA, ponerlo no te va a hacer daño, pero no esperes que mueva nada a corto plazo. Si tienes documentación técnica o una API que otros integran en sus propias herramientas, entonces sí tiene sentido y es una apuesta de futuro razonable.

Implementarlo cuesta diez minutos y hay plugins que lo generan solos, así que como seguro de cara al día en que esto cambie, adelante. Hasta el propio Jeremy Howard reconoce que el estándar está en pañales y predice que algún día emergerá un protocolo formal de rastreo para IA, quizá heredero de este. Curarse en salud es legítimo.

Dos avisos antes. El primero: ni se te ocurra publicar la versión completa, el llms-full.txt, que vuelca todo tu contenido en un único archivo. Eso es servirles a tus competidores y a cualquier rastreador tu biblioteca entera en texto limpio y fácil de copiar. La transparencia está bien; regalar el trabajo de años, no.

El segundo es el que importa. No metas el llms.txt en la casilla de "estrategia de visibilidad en IA", porque ahí no pinta nada, y el presupuesto que le dediques pensando que ese es el trabajo es presupuesto tirado. El trabajo de verdad está en otra parte: en que la IA te tenga construido como una entidad nítida —que sepa con precisión qué eres y para quién—, y en que tu rastro esté densamente ligado a las intenciones que te dan de comer, en las fuentes que el modelo lee de verdad. Eso es lento, caro y difícil de falsificar. Por eso casi nadie lo hace, y por eso funciona. El llms.txt es justo lo contrario: fácil, gratis, y con la sensación reconfortante de haber hecho algo. Lo barato de hacer suele ser barato de ignorar, y eso es exactamente lo que los modelos están haciendo con él.

Hasta OtterlyAI, que vende herramientas de GEO, ha quitado el comprobador de llms.txt de su auditoría, porque su impacto real en cómo te descubre la IA es marginal y distrae de lo que de verdad mueve la visibilidad.

llms.txt vs robots.txt vs sitemap.xml

Los tres son archivos en la raíz de tu dominio y ahí acaba el parecido. El robots.txt es control de acceso: les dice a los rastreadores dónde no pueden entrar, y funciona porque los buscadores acordaron obedecerlo. El sitemap.xml es inventario: lista todas tus URLs para que los buscadores las descubran y rastreen con eficiencia. El llms.txt es una propuesta de orientación: pretende señalarles a los modelos de IA cuáles son tus contenidos más relevantes. La diferencia decisiva es que los dos primeros tienen destinatarios que los respetan desde hace años, y el tercero, por ahora, no.

Preguntas frecuentes sobre llms.txt

¿La IA lee el archivo llms.txt? A día de hoy, apenas. En el experimento más amplio disponible, solo el 0,1% de las visitas de bots de IA fue al archivo, y Google ha confirmado que no lo usa en sus funciones de IA.

¿llms.txt mejora mi posicionamiento o mis citas en IA? No hay evidencia de que lo haga. Ningún gran motor de IA lo usa para rankear o citar, y los estudios de logs no encuentran correlación entre tenerlo y aparecer más en respuestas generativas.

Entonces, ¿para qué sirve llms.txt? Para que herramientas de IA que integran contenido —asistentes de código, copilotos, bots de soporte— consuman tu sitio de forma más limpia y barata. Es infraestructura para integraciones, no una palanca de visibilidad.

¿Debería implementar llms.txt? Si tienes documentación o APIs que otros integran, sí, como apuesta de futuro de bajo coste. Si tu objetivo es que la IA te recomiende a tus clientes, tu esfuerzo rinde más en contenido, entidad y citas por la web.

¿Qué es el llms-full.txt y debo usarlo? Es una versión que vuelca todo tu contenido en un solo archivo. No es recomendable: equivale a entregar tu biblioteca completa a competidores y rastreadores en texto fácil de copiar.

¿Es lo mismo llms.txt que robots.txt? No. El robots.txt controla el acceso de los rastreadores y se respeta desde hace años; el llms.txt es una propuesta de orientación para modelos de IA que, por ahora, esos modelos no leen de forma significativa.


Análisis de Elevam Labs. Si quieres entender dónde se decide de verdad que la IA te recomiende —y no en un archivo de tu raíz—, está en nuestro estudio La cuota invisible.

Por

Asier López Ruiz

20 de junio de 2026 · 10 min

Volver al blog
¿Te interesa aplicarlo en tu empresa?

Hablamos sin compromiso.