Le hicimos a cinco motores de IA la pregunta que se hace cualquier autónomo o pyme española antes de cambiar de programa de facturación. Sin ponerles una sola marca delante. "Quiero dejar de llevar las facturas en Excel, ¿por dónde empiezo?". "Necesito algo para gestionar mi taller de Zaragoza, facturas y clientes". Treinta preguntas distintas, cada una repetida cinco veces, en cinco motores. Setecientas y pico respuestas, analizadas una a una.
Buscábamos una sola cosa: cuando el modelo elige solo, sin que nadie le sople un nombre, ¿a quién recomienda?
A bastante gente que no está en la conversación. De toda la recomendación que repartieron, el 55% se lo llevaron marcas que ni siquiera estaban en nuestra lista de las que cuentan en este sector. FacturaDirecta, Declarando, Cuéntica, a3factura, STEL Order. La reacción inmediata es pensar que eso es ruido, marcas de relleno. No lo es. Es la primera pista de que la IA no está jugando al juego que tú crees que juega.
Este es el primer corte de un estudio de Elevam Labs, medido con Antropus, nuestra plataforma de medición de GEO. Vamos por partes.
Lo que la IA reparte no es cuota de mercado
Cuando recomienda, un modelo no consulta un ranking de quién factura más ni de quién tiene más clientes. No tiene esa tabla. Lo que tiene es un mapa —su grafo de conocimiento— donde cada marca, cada concepto y cada intención es un nodo, y los nodos están unidos por la fuerza con la que aparecen juntos en todo el texto que el modelo ha leído. Cuando alguien pregunta "programa para facturar siendo autónomo", el modelo arranca en el nodo de esa intención y trae las marcas que tiene más fuertemente cableadas a ese nodo. La recomendación es el resultado de ese recorrido.
Y ese mapa no se construye con facturación. Se construye con texto. Por eso lo que reparte la IA es una cosa distinta de la cuota de mercado, una cosa que casi nadie está midiendo: tu presencia dentro del grafo del modelo para las intenciones que te dan de comer. Llámalo cuota de grafo. Puede parecerse a tu cuota de mercado o puede no tener nada que ver con ella. Y cuando un cliente le pregunta a ChatGPT, la que manda es la segunda.
Hallazgo 1 · Cuota de grafo, no cuota de mercado
El 55% de la recomendación se la llevan marcas que no tenías fichadas.
44,9%
Holded, Quipu, Contasimple, Billin, Anfix, Sage y Zoho —las que cualquiera vigilaría—. Entre las siete juntas no llegan a la mitad de la recomendación en ciego.
55,1%
FacturaDirecta, Declarando, Cuéntica, a3factura, STEL Order… Varias son negocios pequeños, pero su rastro está densamente pegado a la intención del autónomo. La IA las tiene cableadas justo al nodo que el usuario toca.
La IA no consulta un ranking de quién factura más: recorre su grafo de conocimiento y trae lo que tiene mejor conectado a la intención. Eso es cuota de grafo, y puede divergir de tu cuota de mercado hasta dar miedo.
Esto, que suena abstracto, explica con precisión todo lo que encontramos en los datos.
Sage existe, pero está enchufada al cable equivocado
Sage es la marca con más músculo del set. Cuando le preguntas a un modelo directamente por ella —"¿es buena Sage para llevar la contabilidad de una pequeña empresa?"— responde con criterio, la reconoce como una opción seria, la describe bien. En reputación, cuando preguntas por ella, puntúa altísimo. El modelo sabe perfectamente qué es Sage.
Y aun así, cuando el usuario no la nombra, Sage casi no aparece. Esta es la cuota de recomendación en ciego de las siete marcas conocidas:
Hallazgo 2 · Cuota de recomendación en ciego
Sage es la marca que el modelo mejor conoce. Y sale sexta.
- Holded14,9%
- Quipu8,6%
- Contasimple8,1%
- Billin5,1%
- Anfix4,4%
- SageLa más conocida · 6ª en recomendación3,5%
- Zoho0,3%
La recomendación en ciego no la gana la marca más conocida, sino la entidad mejor conectada a la intención exacta. Sage es un nodo enorme enchufado al cable equivocado: «software corporativo», no «el autónomo que se pelea con su gestoría».
Sage, la que más conoce el modelo, en el sexto puesto y por debajo de cuatro nativas más pequeñas. No es una contradicción; es exactamente lo que predice el grafo. El modelo tiene a Sage construida como una entidad fuerte, sí, pero cableada al nodo "contabilidad de empresa, multinacional, software corporativo", no al nodo "el autónomo español que quiere dejar de pelearse con su gestoría". Es un nodo enorme conectado a la intención equivocada.
Las pequeñas no ganan a pesar de ser pequeñas. Ganan por estar bien conectadas
Ese 55% que se va fuera del set no son marcas mejores ni más grandes. Declarando, Cuéntica, FacturaDirecta son, varias de ellas, negocios pequeños. Ganan recomendación por una razón concreta: su rastro en el texto español está densamente pegado a la intención específica del autónomo. Aparecen una y otra vez en artículos sobre el modelo 130, sobre el IRPF del freelance, sobre Verifactu, sobre cómo darse de alta. El modelo las tiene cableadas, fuerte, a justo el nodo que el usuario está tocando.
El grafo no premia el tamaño de tu marca. Premia la densidad de la conexión entre tu entidad y la intención. Una marca diminuta puede ser, para un nodo-intención muy concreto, un nodo más fuerte que una multinacional. Y eso cambia por completo dónde se juega la partida: no se gana siendo más grande, se gana siendo, para esa intención, más inequívoco.
No existe "la IA". Existen cinco grafos distintos
Aquí está el dato que debería frenar en seco a cualquiera que esté montando su estrategia de visibilidad en IA como si fuera un bloque. La misma marca está construida de forma distinta en cada modelo. Mira a Holded:
Hallazgo 3 · No existe «la IA». Existen cinco grafos
La misma marca, Holded, va de líder absoluto a un nombre más entre la multitud.
- Claude26,1%
concentra: pocas marcas, con fuerza
- Google AI Overview21,9%
concentra
- Google AI Mode17,5%
intermedio
- Perplexity11,7%
abre el abanico
- ChatGPT3,2%
reparte: muchas marcas, cada una diluida
«Salgo en la IA» no significa nada hasta que dices en cuál. Cada modelo aprendió de un corpus distinto y comprime distinto: ChatGPT suelta listas largas y diluye al líder; Claude da pocas opciones y al que mete lo mete con ganas.
Holded es el líder absoluto en Claude y en el bloque generativo de Google, y un nombre más entre la multitud en ChatGPT. No porque ChatGPT lo trate mal, sino porque cada modelo aprendió de un corpus distinto y comprime de manera distinta: ChatGPT tiende a soltar listas largas, y en una lista larga el líder pierde peso; Claude da pocas opciones y al que mete lo mete con ganas. Cada uno tiene su propio mapa, con sus propios cables.
Lo que se traduce en una frase incómoda: "salgo en la IA" no significa nada hasta que dices en cuál. Lo que te coloca arriba en un grafo puede dejarte diluido en otro. Una estrategia que no trabaja motor por motor está disparando a un bulto que en realidad son cinco dianas, cada una moviéndose a su aire.
La historia que la IA cuenta sobre ti la escribe otro
¿Con qué construye el modelo la ficha que tiene de tu marca? ¿Con lo que tú dices de ti, o con lo que dicen los demás?
Con lo que dicen los demás, casi siempre.
Hallazgo 4 · La ficha que la IA tiene de ti la escribe otro
4 de cada 5 veces, la fuente en la que se apoya el modelo es un tercero.
Fuentes de terceros (comparador, medio, ranking, YouTube)
Dominio oficial de la marca
YouTube
La fuente individual más citada de todo el estudio
21%
Suman los 5 dominios más citados: concentración moderada, no oligopolio
Tu entidad en el grafo no la controlas tú: la redactan terceros, y te enteras el último. Aparecer en la IA y gobernar lo que dice de ti son dos cosas distintas; la segunda es la que protege un negocio.
El nodo que el modelo tiene de ti está hecho, en su mayoría, de material ajeno. Si un comparador te puntúa mal, si un artículo te mete en la lista equivocada, si un vídeo de hace dos años te describe con un producto que ya no vendes, eso es lo que entra en tu ficha. Tu entidad en el grafo no la controlas tú; la están redactando terceros, y tú te enteras el último. Aparecer en la IA y gobernar lo que dice de ti son dos cosas distintas, y la segunda es la que de verdad protege un negocio. De eso va, en el fondo, corregir lo que ChatGPT dice de tu empresa.
De diez opciones a cuatro
En una búsqueda de Google ves diez resultados y, si te pica la curiosidad, bajas a mirar más. La IA no te deja: te da una respuesta corta con un puñado de nombres y punto.
Hallazgo 5 · De diez opciones a cuatro
En Google, ser el sexto te da una línea. En la IA, ser el sexto es no existir.
Google · resultados que ves (y puedes bajar a por más)
IA · marcas distintas por respuesta, de media
No es una compresión brutal —las tres líderes solo acaparan el grueso en un 7,6% de las respuestas, no hay monopolio—. Pero pasar de diez a cuatro deja fuera a más de la mitad de los que eran visibles.
Seamos honestos con el matiz, porque importa para no vender humo: no es una compresión brutal donde tres marcas se lo llevan todo. La elección se reparte entre unas cuatro, y las tres líderes solo acaparan el grueso de la recomendación en un 7,6% de las respuestas. No hay monopolio. Pero pasar de diez a cuatro ya deja fuera a más de la mitad de los que eran visibles. En Google, ser el sexto todavía te da una línea. En la IA, ser el sexto es no existir para ese usuario.
Lo que esto cambia para quien reparte el presupuesto
Cinco cosas, para quien decide dónde va el dinero y no para quien rellena un informe de visibilidad.
- 01
Tu cuota en la IA no la sabes hasta que la mides
Y no es la que asumes por tu posición en Google ni por tu notoriedad. Lo primero es saber dónde estás de verdad, y motor por motor, porque no hay una sola foto.
- 02
El presupuesto de SEO y el de marca no te están comprando este asiento
Sirven para otras cosas. Esto se juega en cómo el modelo te tiene construido como entidad y a qué intenciones te tiene conectado, que es un tablero aparte y conviene tratarlo como una partida aparte.
- 03
El trabajo de fondo no es solo tu web
Es tu entidad —que el modelo sepa con nitidez qué eres y para quién— y tus conexiones —estar densamente asociado a las intenciones concretas que te dan dinero, en las fuentes que el modelo lee—. Cuatro de cada cinco veces, esas fuentes son terceros.
- 04
Tienes competidores que no tienes fichados
Dentro de la decisión de compra de tu cliente hay marcas que la IA recomienda y que tú no estás mirando. Vigilar solo a los sospechosos habituales te deja ciego ante más de la mitad del mercado que la IA reparte.
- 05
El objetivo deja de ser que te recomienden
El objetivo es existir, bien definido y bien conectado, como entidad en el grafo del modelo para lo que te importa. Tu cuota de mercado y tu cuota de grafo pueden divergir hasta dar miedo, y es la segunda la que decide la recomendación. Puedes liderar tu mercado y ser, para la IA, un nodo débil.
Si quieres ver tu propia foto —dónde estás en cada motor, a qué intenciones te tiene conectado y quién te está comiendo la recomendación sin que lo sepas—, eso es exactamente lo que hacemos en la auditoría de visibilidad en IA de Elevam.
Cómo lo medimos
Treinta preguntas comerciales reales en español, repartidas en seis tipos —reputación, descubrimiento, comparativa, caso de compra, precio e integración—, la mayoría sin nombrar ninguna marca, que es donde el modelo elige de verdad. Cada una cinco veces, en ChatGPT, Claude, Perplexity y los dos modos generativos de Google.
739
Respuestas válidas
Cada una guardada entera, con su texto íntegro. La base de todo.
469
Preguntas a ciegas
Sin nombrar marca: la base sobre la que se calcula la cuota.
96%
Acuerdo del juez
Coincidencia con un modelo mayor dentro de un escalón de la rúbrica.
Todo el análisis corre sobre Antropus: es lo que puntúa la fuerza de cada recomendación con una rúbrica fija, lo que resuelve la entidad para no confundir una marca con un homónimo, y lo que clasifica cada fuente como propia o de terceros. La cuota se calcula solo sobre las preguntas a ciegas, ponderando la fuerza de cada recomendación y contando a cualquier marca que el motor nombre —no solo a las fichadas—, que es lo que destapa el 55% invisible.
Los límites, sin maquillar. Esto es un piloto de un solo nicho —gestión y facturación para autónomos y pymes en España—, una foto, no una serie temporal ni un censo. Gemini se quedó fuera de la cuota porque se le agotó el límite de la API a mitad del estudio; entra en la próxima vuelta, que pasará de cinco motores a seis. Y una cosa por honestidad intelectual: entramos esperando encontrar un oligopolio de fuentes, unos pocos dominios controlándolo casi todo. No salió: la concentración existe pero es moderada, los cinco dominios más citados suman el 21%. Lo contamos porque medimos para decir lo que hay, no lo que íbamos a buscar.
Anexo metodológico y de verificación
Esta sección existe para una sola cosa: que cualquiera pueda comprobar que los números salen de mediciones reales y no de la nada. Es lo que hace verídico el estudio. Todo lo de aquí es trazable hasta el dato crudo.
Cobertura real (lo que entró en los números y lo que no)
| Motor | Respuestas válidas | Nota |
|---|---|---|
| ChatGPT | 150 / 150 | |
| Claude | 150 / 150 | |
| Perplexity | 150 / 150 | |
| Google AI Mode | 150 / 150 | |
| Google AI Overview | 139 / 150 | Los 11 huecos = el AI Overview no se activó. Es una señal real, no un fallo. |
| Gemini | 5 / 150 | Se le agotó la cuota de la API a mitad del lote. Excluido de la cuota. |
Totales sobre cinco motores: 739 respuestas válidas · 469 a ciegas (base de la cuota) · 99 de reputación · 171 comparativas. Gemini queda fuera del análisis de cuota porque no es un hallazgo sobre Gemini, es un límite de cuota de la API; sus 5 respuestas válidas sí cuentan en el análisis de fuentes.
Cómo se validó que la medición es fiable
Las 900 respuestas las puntuó un modelo siguiendo una rúbrica fija de cinco valores. Para no darlo por bueno sin más, se volvió a puntuar una muestra con un modelo mayor (el caro) y se midió el acuerdo:
| Muestra | Pares | Acuerdo exacto | Dentro de un escalón | Error medio |
|---|---|---|---|---|
| Smoke previo | 45 | 67 % | 100 % | 0,083 |
| Lote (datos reales) | 23 | 65 % | 96 % | 0,098 |
Coinciden en el 96% de los casos dentro de un escalón de la rúbrica, con cero divergencias grandes salvo un único caso. La cuota se apoya en una puntuación medida, no asumida.
Antes de cerrar números, el pipeline pasó una auditoría adversarial con verificación por refutadores independientes: 22 problemas detectados, 21 confirmados y corregidos. Tres eran lo bastante serios como para mover la cifra titular:
- Las preguntas comparativas se estaban colando en el cálculo de cuota, lo que inflaba a las marcas conocidas a un falso 57,1%. Corregido, la cifra real bajó al 44,9%.
- La resolución de los enlaces-redirect de Gemini estaba sin funcionar (recuperaba 0). Corregido, recuperó 63 de 63.
- Faltaba una comprobación de que el lote estuviera completo antes de calcular. Corregida: ahora el análisis avisa si los datos están a medias.
Otros corregidos: los homónimos (Sage Publishing, el quipu inca) y los "no mencionado" dejaron de contar como presencia; las variantes de un mismo nombre se unificaron (STEL Order = Stelorder); se vetaron las no-marcas (Verifactu, que es la normativa; la Agencia Tributaria); los subdominios propios cuentan como propios; y los porcentajes cierran a 100.
Verificación independiente del dataset
Para no quedarse en la palabra del pipeline, el dataset crudo se recomputó desde cero con un análisis aparte —sin usar el código del motor, solo las 900 filas en bruto—:
La reproducción al último decimal de cada marca requiere el motor de Antropus, que es propietario; el dato en bruto, que es lo que sostiene la credibilidad de cara a terceros, es lo que aquí se documenta. Coste total del piloto: entre 10 y 11 euros (preparación y pruebas, lote completo, y la validación del modelo que puntúa).
Preguntas frecuentes
¿Qué es la cuota de grafo?
Es tu presencia dentro del grafo de conocimiento de un modelo de IA para las intenciones que te dan clientes: con qué fuerza tu marca está conectada a la pregunta que hace el comprador. No es tu cuota de mercado (cuánto facturas) ni tu notoriedad (cuánto te conocen), es a qué nodo-intención te tiene cableado el modelo. Cuando alguien pregunta sin nombrar marcas, la IA recomienda según esa conexión, no según tu tamaño.
¿Por qué Sage, la marca que la IA mejor conoce, casi no la recomienda?
Porque el reconocimiento construye un nodo grande, pero no garantiza que esté enchufado donde tú vendes. En el estudio, Sage puntúa altísimo en reputación cuando preguntas por ella, pero en ciego sale sexta (3,5%), por debajo de cuatro nativas más pequeñas. El modelo la tiene cableada a "software corporativo, multinacional", no a "el autónomo español que quiere dejar su gestoría". Es un nodo enorme conectado a la intención equivocada.
¿Es lo mismo aparecer en ChatGPT que en Claude o Perplexity?
No. No existe "la IA" como un sitio único: cada motor aprendió de un corpus distinto y comprime de forma distinta. Holded se lleva el 26,1% de la recomendación en Claude y solo el 3,2% en ChatGPT. "Salgo en la IA" no significa nada hasta que dices en cuál; una estrategia que no trabaja motor por motor está disparando a cinco dianas distintas creyendo que es una.
¿Cómo se mide la cuota de recomendación en la IA?
Se le hacen al motor preguntas comerciales reales sin nombrar marcas, repetidas varias veces para promediar la variación natural del modelo, y se pondera la fuerza de cada recomendación con una rúbrica fija (de recomendación principal a mención con reservas). En este estudio fueron 30 preguntas, 5 motores y 5 repeticiones, analizadas con Antropus, contando a cualquier marca que el motor nombrase —no solo a las fichadas—, que es lo que destapa el 55% invisible.
El marco de entidades y grafo de conocimiento de estas páginas es la mecánica que mejor explica lo que medimos. Es el primer corte de una serie de Elevam Labs: la siguiente entrega lo lleva al dato —cómo tiene la IA construida, atributo a atributo, la ficha de cada marca, y a qué intenciones la tiene conectada—. Esa radiografía, no la cuota de recomendación que es solo su síntoma, es el verdadero terreno del GEO. El primer capítulo de la serie, sobre cómo cambia la recomendación según el idioma de la pregunta, está aquí.
Si quieres replicarlo en tu marca o ver tu cuota de grafo motor por motor, hablamos.
Asier López Ruiz es CEO de Elevam y Antropus, pionero del SEO y el GEO en España. 2× Forbes Best SEO Agencies Spain. Datos generados con Antropus.


