Començaré per la part que ningú t'explica quan et venen un servei de GEO, perquè és l'única que afecta el teu compte de resultats: el risc de pagar per aparèixer a ChatGPT no és que no funcioni. És que algunes de les tàctiques que es venen amb aquesta etiqueta poden carregar-se el trànsit orgànic que ja t'estava portant clients. Pagues per una cosa nova i, de passada, debilites la que funcionava. Aquest és el downside que no apareix en cap proposta comercial.
I el més incòmode de tot: pràcticament ningú que t'ho ven ho ha mesurat en el teu idioma.
Porto des de 2012 ficat en això i els últims dos anys, des d'Elevam Labs, dedicats gairebé en exclusiva a entendre com decideixen els models a qui recomanar. He llegit tot el que s'ha publicat amb un mínim de rigor sobre el tema. I la conclusió és tan simple com rara de sentir en una xerrada de vendes: el GEO en castellà, a dia d'avui, s'està aplicant a ull. Amb un manual escrit per a un altre idioma.
El GEO s'ha convertit en un mercat de llimones
Hi ha un concepte d'economia que explica aquest sector millor que qualsevol post de LinkedIn. El va anomenar George Akerlof i li van donar un Nobel: el mercat de llimones. La idea és aquesta. Quan el comprador no pot comprovar la qualitat del que compra abans de pagar, deixa de competir-se per qualitat i es comença a competir per promesa. I com que la promesa no costa res, guanya el contracte el que més promet, no el que millor treballa. El que més promet sol ser, casualment, el pitjor. Resultat: els bons proveïdors marxen del mercat perquè no poden competir contra el fum, i el fum es queda.
El GEO encaixa en aquest motlle amb una precisió que fa por. Per què? Perquè el comprador no pot verificar res. I això no ho dic jo, ho va demostrar Rand Fishkin amb dades.
El gener de 2026, Fishkin i el seu equip a SparkToro van publicar el més seriós que existeix fins avui sobre això: prop de 3.000 execucions dels mateixos prompts en diversos motors. La troballa és demoledora.
Llegeix-ho un altre cop. Si una agència et promet que et posarà "el primer a ChatGPT", o no ha llegit les dades, o compta amb que tu no les has llegit. Les dues coses haurien de preocupar-te.
I aquí està el cor del problema. Si no pots verificar el resultat, com distingeixes el que sap del que improvisa? No pots. Per això el mercat s'omple de dashboards macos que mesuren coses que es reordenen soles cada cop que prems intro.
El forat del qual ningú parla: tot el rigor està en anglès
D'acord, diràs, però alguna cosa se sap. Sí, alguna cosa se sap. I convé saber-la, perquè és el poc sòlid que tenim.
Sabem, per Ahrefs, que l'acoblament entre rànquejar a Google i ser citat a les respostes d'IA s'ha desplomat: al març de 2026 només el 38% de les citacions dels AI Overviews venien del top-10 orgànic, quan un any abans era el 76%. O sigui, ni tan sols "rànquejar bé a Google" et garanteix ja estar a la resposta d'IA.
Sabem, per Profound i les seves 680 milions de citacions analitzades, que cada motor beu de fonts radicalment diferents: el solapament entre el que cita ChatGPT i el que cita Perplexity és de tot just l'11%. És a dir, no existeix "la IA" com un únic lloc on aparèixer. Hi ha quatre o cinc ecosistemes diferents, cadascun amb les seves regles.
Tot això està bé. El problema és d'on surt.
Mapa d’evidència · Estudis seriosos publicats
Tot el rigor disponible sobre com es comporten els motors amb IA està publicat en anglès. En castellà, zero.
SparkToro (Fishkin)
<1 entre 100
Probabilitat que dues consultes idèntiques a ChatGPT/Google AI tornin la mateixa llista de marques. ~3.000 execucions, gener 2026.
Ahrefs
38%
De les citacions als AI Overviews que vénen del top-10 orgànic al març 2026. Un any abans era el 76%. L'acoblament SEO ↔ IA s'ha desplomat.
Profound
11%
Solapament entre el que cita ChatGPT i el que cita Perplexity. 680 milions de citacions analitzades. No existeix «la IA» com un sol lloc.
Princeton · KDD
+30-40%
Pujada de visibilitat en afegir estadístiques i citar fonts. Únic paper acadèmic peer-reviewed sobre GEO. Queries i contingut en anglès.
0
Cap estudi publicat
Amb metodologia transparent i dades verificables sobre llindars de corroboració en castellà. Aquí és on Elevam Labs està mesurant.
L'únic paper acadèmic seriós sobre optimització per a motors generatius, el de Princeton i companyia al congrés KDD, que va demostrar que afegir estadístiques i citar fonts puja la visibilitat entre un 30% i un 40%: fet amb queries i contingut en anglès.
No hi ha ni un sol estudi publicat amb metodologia transparent que mesuri com es comporta això en castellà. Ni un. I la gent està agafant el playbook anglosaxó, traduint-lo, i venent-lo aquí com si l'idioma fos un detall de format.
No ho és. I aquesta és la part que de debò importa.
El castellà no és l'anglès amb una altra pell
Hi ha un paper que hauria d'estar a la primera diapositiva de qualsevol que parli d'això seriosament, i gairebé ningú el cita. El van publicar Christina Walker i Joan Timoneda, de Purdue, a Political Science Research and Methods, de Cambridge University Press. Peer-reviewed, que en aquest sector ja és una raresa.
El que van fer és elegant: van agafar el mateix prompt, el van traduir a diversos idiomes, i van mesurar com canviava la resposta de GPT segons l'idioma. El resultat? La sortida del model es torna més conservadora en idiomes de societats conservadores i més liberal en idiomes de societats liberals. I, l'important, aquesta diferència es manté de GPT-3.5 a GPT-4. La seva explicació és directa: les normes i creences de qui va produir les dades en cada idioma acaben reflectides a la sortida del model.
Traduït al que ens ocupa: l'idioma del prompt no és una traducció de la mateixa resposta. És una porta a un corpus diferent, amb dinàmiques diferents. Quan preguntes en castellà, el model no està consultant "el mateix que en anglès però traduït". Està tirant d'un tros d'internet completament diferent.
I com és aquest tros? Petit. La mateixa Common Crawl Foundation, que és d'on s'alimenta bona part de l'entrenament d'aquests models, ho reconeix per escrit: les seves dades sempre han estat esbiaixades cap al contingut en anglès. Les xifres ho confirmen.
Quota del corpus d'entrenament per idioma
Estàs jugant en una taula on el teu idioma ocupa una vintena part del tauler.
I per si fos poc, hi ha el que Gianluca Fiorelli ha anomenat el "problema del castellà global": els motors no distingeixen bé entre el castellà d'Espanya, el de Mèxic i el d'Argentina. Mesclen en una mateixa resposta terminologia regulatòria i comercial de tres continents. Quan preguntes "en castellà genèric", no competeixes contra les empreses del teu mercat. Competeixes contra tota la hispanitat alhora.
I aquí ve la part honesta, que és la que m'importa
Et podria rematar ara dient "i per això en castellà fa falta menys per destacar, contracta Elevam". Seria còmode. I seria mentida, o com a mínim, una veritat a mitges que encara no puc demostrar.
La hipòtesi raonable és que en un mercat més petit, amb menys competidors per nínxol i menys mitjans canònics, n'hi hagi prou amb aparèixer a menys llocs perquè un model et recomani de forma estable. Fishkin té dades que apunten allà: en universos petits, les marques líders arriben a visibilitats del 90% i pico. Per a un penalista en una ciutat concreta, o un concessionari a Mallorca, això probablement juga a favor.
Però hi ha evidència que apunta justament al contrari, i un consultor honest te la posa damunt la taula. Els models al·lucinen més en idiomes amb menys dades, així que aparèixer amb poca corroboració pot significar aparèixer malament, atribuït a un competidor, o desaparèixer l'endemà. Els crawlers visiten menys les pàgines en castellà, així que cada domini teu pesa menys en el model que el seu equivalent anglès. I si el teu sector està colonitzat per marques globals amb domini massiu en anglès (el SEO i el GEO en són l'exemple perfecte: Moz, Ahrefs, Semrush manen), la corroboració en castellà pot quedar aixafada per l'anglosaxona.
Quina de les dues forces guanya? Depèn del nínxol. I la resposta honesta, avui, és que ningú ho ha mesurat. Ni jo.
Així que ho mesurarem
A Elevam Labs estem corrent l'experiment ara mateix. Els mateixos prompts en castellà i en anglès, als quatre motors que importen, executats desenes de vegades cadascun, amb sessions netes i geolocalització fixa. Mesurem una sola cosa: quants dominis independents necessita de debò una marca perquè el model la recomani de forma estable, i si aquest número canvia d'un idioma a l'altre.
I com que no suporto la gent que s'amaga rere un "ja ho veurem", et deixo la meva aposta per escrit.
Crec que en castellà el llistó és més baix. Que en un nínxol local i acotat —un penalista en una ciutat, un concessionari en una illa— amb estar bé en tres a cinc dominis amb autoritat probablement n'hi hagi prou, mentre que en el seu equivalent anglès, barallat per mil marques, en farien falta set o deu. Per què ho crec? Perquè el mercat hispà per nínxol és més petit i hi ha menys mitjans de referència, així que un grapat de fonts satura abans la resposta.
L’aposta · Llindar de corroboració per idioma
Quants dominis independents necessita una marca perquè el model la recomani de forma estable.
Però és una aposta, no un titular. I hi ha evidència seriosa que apunta justament al contrari: els models mesclen tot el castellà del món a la mateixa resposta, al·lucinen més quan tenen menys dades en el teu idioma, i tiren de fonts en anglès quan les locals escassegen. Qualsevol d'aquestes tres coses em pot deixar amb el cul a l'aire. Ho sabré quan tingui les dades, no abans.
I això és l'únic que prometo: quan les tingui, les publico senceres. La metodologia per davant, els límits llistats abans que les conclusions, el dataset damunt la taula perquè qualsevol intenti trencar-lo. Si m'he equivocat, ho llegiràs aquí, amb el meu nom al costat. Prefereixo ser el que et va ensenyar la seva aposta i la prova completa que el que et va vendre una certesa que no existeix. Així és com es construeix una cosa en què es pugui confiar. I així és com hauria de funcionar aquest sector i no funciona.
Mentrestant, com distingir qui sap de qui improvisa
Com que l'experiment trigarà unes setmanes i tu potser tens una proposta de GEO damunt la taula aquesta mateixa tarda, et deixo l'únic filtre que necessites. Tres preguntes. Si el proveïdor no passa les tres, és una llimona.
Té dades pròpies o et cita les d'altres? Si tot el que et mostra són estudis anglosaxons traduïts, t'està venent el manual d'un altre. Pregunta-li què ha mesurat ell, en castellà, amb la seva metodologia.
Et promet ranking o et parla de probabilitat d'aparició? Qui et garanteix el "número u a ChatGPT" o no ha llegit Fishkin o compta amb que tu no. Qui et parla de freqüència de menció al llarg de moltes execucions, sap de què va això.
Comença pels fonaments o per la purpurina? Si el primer que et proposa són FAQs sintètiques i refrescos massius de contingut per "disparar citacions", fuig. Aquestes són justament les tàctiques que poden enfonsar-te l'orgànic. Qui sap comença per l'autoritat real: per estar, de debò, a llocs que valgui la pena citar.
No et diré que el GEO no serveix. Serveix, i molt, i el que no se'l prengui seriosament d'aquí a tres anys ho lamentarà. El que et dic és que gairebé tot el que es ven avui en castellà està fet amb un mapa d'una altra ciutat, i que l'honestedat en aquest sector escasseja tant que s'ha convertit, ella sola, en un avantatge competitiu.
Nosaltres mesurarem el mapa d'aquesta ciutat. Quan el tinguem, t'ho ensenyo.
Asier López Ruiz és CEO d'Elevam, empresa pionera en SEO i GEO a Espanya. Aquest article es publica juntament amb un annex descarregable amb totes les fonts i la metodologia de la revisió de literatura en què es basa.


