Glosario GEO

Generative Engine Optimization (GEO): glosario de métricas y conceptos

Qué es GEO

¿Qué es Generative Engine Optimization (GEO)?

Generative Engine Optimization (GEO) es la optimización orientada a motores de IA generativa como ChatGPT, Gemini, Perplexity y Google AI Mode para aumentar la probabilidad de mención, citación y URL atribuida correcta de una marca.

El término Generative Engine Optimization (GEO) se utiliza en marketing digital para describir la optimización específica para motores de IA generativa.

GEO no busca únicamente posicionamiento en buscadores tradicionales, sino presencia verificable dentro de respuestas generadas por modelos de inteligencia artificial.

En Elevam, la aplicación práctica de GEO se desarrolla desde la página principal de Agencia GEO.

Qué significa

¿Qué significa GEO en este contexto?

En marketing digital, GEO significa Generative Engine Optimization.

En este contexto, GEO:

No hace referencia a geopolítica.
No hace referencia a fuerzas policiales.
No hace referencia a geolocalización.

Se utiliza exclusivamente para describir la optimización orientada a motores de IA generativa.

Relación con HSA

Relación entre GEO y el Protocolo HSA

El Protocolo HSA es la metodología de Elevam para aplicar Generative Engine Optimization de forma estructurada y medible.

Mientras GEO define el marco conceptual, HSA establece las reglas prácticas para implementarlo y evaluarlo mediante un sistema de baseline y mediciones periódicas.

Enfoque	Optimiza	Objetivo principal
SEO	Optimiza:Motores de búsqueda	Objetivo principal:Tráfico orgánico
AEO	Optimiza:Motores de respuesta	Objetivo principal:Respuesta directa y fragmentos citables
GEO	Optimiza:Motores generativos (LLMs)	Objetivo principal:Mención, citación y URL atribuida correcta

Métricas titulares del Baseline GEO

SoR — Share of Recommendation: Fuerza media con la que los motores de IA recomiendan la marca, ponderada por la intensidad de la recomendación test a test. Métrica titular del canon de visibilidad GEO de Antropus. Un SoR alto implica recomendaciones claras; un SoR bajo, menciones débiles o ambiguas.
SoM — Share of Mentions: % de tests válidos donde la IA mencionó la marca con entidad correctamente identificada. Primer escalón del embudo de recomendación. La diferencia mentionRate − SoM revela cuántas menciones son de la entidad equivocada.
CS — Citation Share (BCR): % de tests válidos donde la IA citó al menos una fuente del dominio de la marca. Titular de citación del canon v1.2. Gap CR − CS = la IA cita fuentes en el sector, pero no las tuyas.
CR — Citation Rate: % de tests donde la IA incluyó alguna fuente citada, propia o ajena. Mide el comportamiento del motor, no de la marca. CR alto no implica que te citen a ti. Para visibilidad vía citación, usar CS.
R — URL Rate: % de tests con URL canónica mapeada donde la URL citada coincide con la esperada para la intención del prompt. CS alto con R bajo: te citan, pero apuntando a una página irrelevante para lo que el usuario preguntaba.
Top 3 — Top 3 Rate: % de tests con ranking ordenado donde la marca aparece en posiciones 1-3. Solo cuentan listas con orden explícito: numeradas, tablas markdown o ordinales léxicos. Si el motor no genera rankings para el sector, la métrica devuelve «—».
Hallucination Rate: % de tests visibles donde la IA produjo alguna alucinación sobre la marca. Se clasifica en seis tipos: confusión de entidad, confusión de siglas, atribución errónea, topic drift, factual inventada y ninguna. A más bajo, mejor.

Control, riesgo y diagnóstico

Fragile Recommendation Rate: % de tests con recomendación fuerte (rsw ≥ 0,75) acompañada de información falsa. El escenario de mayor riesgo reputacional: la IA recomienda la marca con claridad, pero con datos inventados. Bajo es bueno.
Validity Rate: % de tests aplicables que resultaron metodológicamente válidos. Un valor bajo (< 70 %) indica confusión de entidad recurrente o prompt set mal calibrado que descarta demasiados tests. Métrica de control de calidad del baseline.
Triggering Rate: En modo SERP-generativo (Google AI Mode, AI Overview), % de prompts que activó respuesta de IA. Por debajo del 50 %, la UI muestra aviso de baja activación. En motores chat-LLM (ChatGPT, Claude, Perplexity…) siempre es null.
Mention Rate: % de tests donde la IA nombra la marca, sin aplicar el filtro de entidad correcta. Diagnóstico bruto: la diferencia mentionRate − SoM mide la tasa de colisión de entidad (te nombran confundiéndote con otra marca).

Embudo de recomendación

Funnel Stage 1 — Mención válida: Capa 1 del embudo. % de tests visibles donde la IA mencionó la marca con entidad correcta. Equivalente a SoM. Representa la entrada del embudo: ¿la IA habla de ti sin ambigüedad de entidad?
Funnel Stage 2 — Mención + fuente propia: Capa 2 del embudo. De los tests de la capa 1, % donde además la IA citó al menos una fuente del dominio de la marca. El gap Stage 1 − Stage 2 revela cuántas veces te mencionan sin citarte.
Funnel Stage 3 — Mención + fuente + URL correcta: Capa 3 del embudo. De los tests de la capa 2, % donde la URL citada es la correcta para la intención del prompt. Entrega completa: mención válida, cita propia y URL adecuada a la intención.

Soporte documental y cuota de fuentes

SoS — Share of Sources: Del total de fuentes citadas por la IA en el baseline, % que pertenece al dominio de la marca. Mide cuota de volumen, no presencia por test. CS alto con SoS bajo indica que te citan con una URL mientras a los competidores los citan con varias.
Owned Source Share: % de tests donde la IA cita exclusivamente fuentes propias, sin terceros. Alto = control narrativo. Puede leerse también como aislamiento del consenso externo y ausencia de validación de fuentes independientes.
Third Party Dependency: % de tests donde la IA menciona la marca apoyándose solo en fuentes de terceros. Señal de que el contenido propio no está siendo reconocido como fuente autoritativa por los motores.
Unsupported Positive Rate: % de tests con sentiment positivo y ninguna fuente citada. Visibilidad frágil: sin ancla documental, la posición depende de la memoria del modelo y puede desaparecer entre mediciones.
Source Dispersion Index: Promedio de URLs propias únicas citadas por intención. Un valor de 1,0 indica página canónica clara por intención; valores altos señalan dispersión de contenido o ausencia de página de referencia definitiva.
Competitor Leakage Rate: % de tests donde la IA cita URLs de competidores configurados en el proyecto. Mide la fuga directa de atención hacia la competencia en respuestas sobre el sector de la marca.

Modelo mental GEO y recuperabilidad

Señales → recuperación → citación → síntesis → shortlist: Cadena completa de cómo una marca llega a ser recomendada por un motor de IA. Cada eslabón es condición necesaria del siguiente: sin señales no hay recuperación; sin recuperación no hay citación.
Shortlist: El conjunto de 3-5 opciones que la IA decide incluir en su respuesta. Entrar en la shortlist es el objetivo operativo de GEO: es más determinante que el posicionamiento en SERP clásico para los queries de alta intención.
Recuperabilidad: Condición de que el sistema RAG pueda encontrar y recuperar tu contenido cuando lo necesita. Requisito previo a cualquier citación: si no se recupera, no se cita.
Citable: Contenido que contiene datos, cifras, afirmaciones o ventajas únicas suficientemente específicas para merecer ser referenciadas como fuente en una respuesta generativa.
RAG-friendly: Páginas diseñadas para ser recuperadas y usadas como soporte factual en pipelines RAG: estructura clara, chunks semánticos, datos verificables y consistencia entidad-contenido.
Co-mentions: Las marcas, entidades o conceptos con los que la IA te nombra en el mismo contexto. Visualizar co-mentions como grafo revela clusters competitivos, asociaciones de categoría e influencia contextual.
HSA — Framework Human · Search · AI: Metodología de Elevam para aplicar GEO de forma estructurada y medible. Combina cinco componentes (SoM, posición en shortlist, sentiment, citations coverage y análisis de competencia) con pesos definidos y ciclos de medición trimestrales.

Ingeniería LLM y recuperación semántica

RAG — Retrieval-Augmented Generation: Arquitectura donde el modelo de IA, antes de generar una respuesta, recupera fragmentos relevantes de una base documental externa. Es el mecanismo que hace que tus contenidos puedan ser usados como soporte factual.
Embeddings: Representación numérica vectorial de un texto que captura su significado semántico. La distancia entre el embedding de tu contenido y el de un prompt determina si tu fuente se recupera o no en el proceso RAG.
Índice vectorial: Base de datos especializada donde se almacenan embeddings y se realizan búsquedas por similitud semántica. Es la infraestructura sobre la que opera el paso de recuperación del RAG.
Elegibilidad: Condición de estar técnica y semánticamente preparado para ser recuperado y citado: indexación correcta, estructura clara, consistencia entre la entidad de la marca y los contenidos que la describen.

Diseño de experimentos GEO

Dataset fijo de prompts: Conjunto estable de prompts mantenido invariable entre mediciones para poder comparar resultados en el tiempo. Sin fijeza de dataset, no hay comparación válida.
Prompt set por intención: Prompts informacionales, comparativos y transaccionales que cubren el funnel de decisión del usuario. Cada tipo de intención puede activar comportamientos distintos en el motor.
Prompt exacto: Regla de trazabilidad: el prompt registrado debe ser idéntico al enviado al motor. Si se parafrasea o resume, la comparación temporal pierde validez.
Benchmark periódico: Repetición del dataset completo en ciclos aproximados de tres meses para detectar cambios en la visibilidad de la marca en los motores. Permite distinguir tendencias reales de ruido puntual.
Multimotor: Ejecutar el baseline en un mínimo de 3 motores o plataformas distintas para evitar sesgos de un único proveedor. Cada motor tiene pesos, fuentes y comportamiento diferentes.
Logging estructurado: Guardar cada resultado como dato estructurado (CSV, JSON) con prompt, respuesta completa, fuentes citadas y metadatos del motor. Los pantallazos sueltos no son datos.
Update log: Registro fechado de cambios observados en modelos, tono de respuesta o fuentes preferidas. Sin evidencia documentada, no hay update válido.
Biblioteca de ejemplos: Repositorio centralizado de pares prompt → respuesta → fuentes citadas. Base de conocimiento que permite auditar la evolución del comportamiento de los motores en el sector.

Controlabilidad, rigor y automatización

Marco de controlabilidad: Clasificación de variables en tres niveles: controlas (tu contenido, estructura, schema markup), influyes (narrativa de terceros, co-mentions) y no controlas (pesos del modelo, temperatura, política de citación del motor).
Modelo probabilístico: Los motores de IA no son deterministas: el mismo prompt puede producir respuestas distintas. Por eso medir con método —mismos prompts, mismo motor, comparación temporal— es la única forma de detectar cambios reales.
Umbral de evidencia: Criterio para decidir si un cambio en las métricas es real o ruido estadístico. Requiere repetición del dataset y logging estructurado antes de concluir que algo mejoró o empeoró.
Pipeline GEO: Sistema automatizado para ejecutar el prompt set, registrar respuestas, parsear métricas y reportar resultados sin intervención manual. Elimina el error humano y escala la medición.
Observabilidad GEO: Monitorización continua del comportamiento de los motores y del propio pipeline de medición, con alertas que avisan cuando las respuestas o las fuentes citadas cambian de forma anómala.
Pruebas de regresión: Repetición del dataset completo tras actualizaciones de modelos para detectar degradaciones de métricas antes de que afecten a los clientes. El equivalente de tests de CI/CD en visibilidad GEO.

Competitor Intelligence — análisis por respuesta

BrandMention: Estructura producida por el analyzer en cada respuesta para cada marca evaluada. Contiene: si fue mencionada, posición en ranking, sentiment (−1 a 1), URLs citadas y hasta tres atributos descriptivos extraídos de la respuesta. Componente base de todo el agregado del estudio CI.
EmergingBrand: Marca detectada por la IA en una respuesta que no estaba configurada en la lista de competidores del estudio. Permite descubrir competidores que la IA ya reconoce en el sector pero que el proyecto no tenía en el radar. Se muestran las 12 más mencionadas ordenadas por menciones.
ConfusionBrand: Marca emergente que coincide con las entidades marcadas como «no soy yo» en el perfil de entidad del proyecto. Cuantifica cuánto la IA confunde activamente la marca con otra entidad no deseada. Señal de problema agudo de identidad de marca.
CompetitorResponseType: Clasificación del tipo de respuesta de la IA en seis buckets: provider_shortlist, comparison, educational_no_brands, generic_advice, category_mismatch y refusal_or_no_recommendation. Si la mayoría son generic_advice o refusal, el SoV de cualquier marca saldrá bajo por construcción, no por falta de visibilidad real.
AcronymAmbiguity: Detección de que la IA usó una sigla con un significado distinto al esperado en el perfil de entidad. Crítico en sectores donde una misma sigla cubre varios mercados: «GEO» puede ser Generative Engine Optimization o Geographic Information; «AI» puede ser Artificial Intelligence o Avian Influenza.
MethodHallucination: Uso erróneo por la IA de un término técnico configurado en el perfil de entidad del proyecto. Detecta deformación del vocabulario propio: si la IA explica «Protocolo HSA» con una definición distinta a la del proyecto, está confundiendo al cliente final. Severity: critical / warning / info.
EntityResolutionResult: Resolución granular de qué entidad reconoció la IA al hablar de la marca. Seis estados: correct_entity, not_mentioned, entity_confusion, ambiguous_entity, wrong_domain e insufficient_evidence. Solo correct_entity cuenta como mención válida en SoV. Es el gating que evita inflar la métrica con confusiones de identidad.
sourceReliabilityScore: Score 0-100 de fiabilidad de una respuesta según la naturaleza de las fuentes citadas. Lógica: modo memoria sin fuentes → 0; URLs opacas → 50; mix opacas y reales → 60; URLs auditables → 75. Alimenta el Reliability Weight que modula el SoV en modo ponderado. No llega a 100: ningún motor IA garantiza fiabilidad total hoy.

Competitor Intelligence — visibilidad agregada y comparador

SoV — Share of Voice: Reparto de menciones entre las marcas del estudio CI. Por marca: mentionRate, posición media en rankings, sentiment medio y total de apariciones. Conmutable entre modo raw (conteo directo de menciones) y weighted (ponderado por sourceReliabilityScore). Métrica titular del módulo Competitor Intelligence.
Reliability Weight: Peso 0-1 aplicado a cada análisis según su sourceReliabilityScore: score ≥ 75 → 1,0; 50-74 → 0,7; < 50 → 0,4. Respuestas en modo memoria → 1,0 (sin penalización, no había fuentes que evaluar). Multiplicador interno: no se muestra al cliente, pero determina el SoV ponderado.
Reliability Summary: Agregado de fiabilidad a nivel de estudio: promedio del sourceReliabilityScore, conteo de análisis con score ≥ 75 (auditables) y total de análisis. Si el promedio baja de 50, la UI muestra un caveat visible sobre las conclusiones del estudio.
Distribución ResponseType: Conteo de análisis por cada bucket de CompetitorResponseType. Diagnóstico macro: si la distribución está dominada por refusal_or_no_recommendation o generic_advice, la IA evita recomendar en ese sector y cualquier SoV bajo es estructural, no un fallo de visibilidad de la marca.
BrandDelta: Diferencia de SoM por marca entre dos estudios CI consecutivos. Con scope-awareness: distingue «cayó a 0» (medida en ambos estudios, perdió visibilidad real) de «no se midió en el segundo estudio» (cambio de configuración). Las marcas fuera de scope devuelven null, no 0.
ResponseTypeDelta: Diferencia de distribución de CompetitorResponseType entre dos estudios. Detecta cambios en el modo de respuesta de la IA en el sector: subida en refusal indica cautela creciente del motor; subida en provider_shortlist indica mayor actividad recomendadora.
ConfigDivergence: Detección de configuración distinta entre los dos estudios comparados: listas de marcas diferentes o número de análisis distinto. Cuando aplica, la UI muestra un banner CrossConfigWarning. Protección de honestidad: el cliente no puede leer un BrandDelta sin saber si los dos estudios son comparables.
Comparator Buckets: Clasificación de marcas según el cambio observado entre estudio A y B en cuatro buckets: droppedToZeroInB (cayó del radar, pérdida real), roseFromZeroInB (emergió entre mediciones), outOfScopeInB (estaba en A, no en B; cambio de configuración), newInScopeOfB (no estaba en A, sí en B; incorporación al seguimiento).

MetodologíaProtocolo HSAVer metodología InvestigaciónBaselines GEOVer baselines Aplicación prácticaAgencia GEOVer servicio

Continúa explorando

Servicios relacionados

Protocolo HSA

Metodología Elevam para mención y citación en IA

Curso de GEO

Formación práctica en GEO: ~80 h · 499 € IVA incluido

Consultoría GEO

Aparecer citado en Google IA, ChatGPT y Gemini

Elevam Labs

Unidad de I+D en SEO, GEO, AEO y Search IA

Baselines GEO

Serie periódica de medición de mención, citación, URL correcta y Top 3