Measurement GEO 2026 — KPIs, frameworks e atribuição zero-click

Resposta rápida em 3 pontos

Tracking de rank em SERP perdeu primazia em 2026. O pacote principal passou a ser Mention Rate, Citation Rate, SoV-AI e AI-Referred Traffic, com Net Sentiment Score e Citation Position em camada de qualidade.
ChatGPT responde por 87,4% do tráfego de referência de assistentes, e visitantes vindos de IA convertem entre 2,3 e 4,4 vezes mais que o orgânico tradicional segundo Discovered Labs e Lantern.
CTR orgânico na posição 1 com AI Overview caiu de 27 para 11% no levantamento SISTRIX de março de 2026. AI Mode do Google entrega 93% de queries zero-click; medir só rank é desinformar o board.

Tese contraintuitiva: tracking de rank em SERP perdeu primazia em 2026

O instinto operacional de medir SEO ainda manda observar posição na página de resultados do Google. Em 2026 esse instinto se tornou anacrônico. AI Overviews subiram de 6,49% das queries no Google em janeiro de 2025 para 13,14% em janeiro de 2026 — alta de 102% ano contra ano segundo Position Digital. O AI Mode entrega 93% de queries zero-click segundo Success.com. O overlap entre top-10 da SERP tradicional e citações em AI Overview caiu de 75% em meados de 2025 para uma faixa entre 17 e 38% no começo de 2026, segundo The Digital Bloom. Estar em primeiro lugar no Google deixou de ser proxy confiável de visibilidade em respostas de IA.

A inversão necessária é metodológica. A pergunta de board deixa de ser estamos em primeiro no Google e passa a ser quantas vezes a marca é citada com link nas respostas que ChatGPT, Perplexity, Claude, Copilot e Gemini geram para os 50 a 150 prompts principais da nossa categoria. A literatura de 2025-2026 convergiu em um pacote de quatro KPIs primários (Mention Rate, Citation Rate, SoV-AI, AI-Referred Traffic), três KPIs de qualidade (Net Sentiment Score, Citation Position, Hallucination Rate) e duas camadas de input (AI Bot Activity, Entity Density). O glossário completo está no JSON principal publicado em /mcp/kpis-geo.json — 24 termos com termCode estável para reuso em deck e dashboard.

A consequência prática para um portal editorial como este, focado em pós-graduação em Psicologia, é dupla. Primeiro, o dashboard executivo precisa cobrir as três camadas (presença, qualidade, outcome) e não só a primeira — vendors de baixo custo cobrem apenas presença e enviesam a leitura. Segundo, métrica nenhuma vale sem proveniência: cada número que aparece em deck precisa de URL principal para auditoria, sob pena de repetir o caso GeoScore Analytics, em que a Federal Trade Commission interveio em agosto de 2025 contra dashboard que reportava citações que não correspondiam a queries reais de usuário (referência preservada via snippet de search — [VERIFICAR]: site fora do ar em 17/05/2026). Para instituições brasileiras que querem calibrar expectativa antes de contratar dashboard, o benchmark de mention rate de marcas brasileiras em 7.052 respostas de LLMs oferece referência empírica de quão raras são as citações fora do varejo digital de massa.

Seis KPIs principais com fórmula publicada

Recorte do pacote operacional de 2026 que sobrevive a auditoria de método. Tabela completa com 24 KPIs no JSON principal.

KPI	Fórmula resumida	Origem	Como ler
Mention Rate	prompts com nome da marca dividido pelo total de prompts principais	Profound, Otterly, Peec	KPI mais difundido. Mais fácil de inflar. Só faz sentido pareado com SoV-AI.
Citation Rate (com link)	(prompts onde a marca aparece como fonte clicável dividido pelo total de prompts) vezes 100	Discovered Labs, Averi, Profound	Mais conservadora, mais correlacionada com tráfego e conversão. Benchmark Discovered: 8-15% inicial, 20-30% otimizado, 40-50% liderança de categoria. Branded: acima de 80%.
AI Share of VoiceSoV-AI	(menções ou citações da marca dividido pelo total de menções competitivas no universo de prompts) vezes 100	Ahrefs Brand Radar, Otterly, SEMrush AI Toolkit	Substitui rank tracking como bússola estratégica em 2026. Ahrefs publica metodologia; SEMrush mistura prompts sintéticos e não publica engenharia de query.
AI-Referred Traffic	sessões com referrer ou UTM de chatgpt.com, perplexity.ai, claude.ai, copilot.microsoft.com ou gemini.google.com	GA4 Custom Channel Group + Looker / Data Studio	Cobertura parcial. Quatro mecanismos estripam referrer (rel=noreferrer, strict-origin, WKWebView, copy-paste). Sempre cruzar com server logs.
Net Sentiment ScoreNSS	((endossos + neutros − negativos − alucinações) dividido pelo total) vezes 100; varia de −100 a +100	Sight AI, Indexly, Brandlight	Posição da marca dentro da resposta (líder, comparador, budget). Decompor por engine sempre — agregado global esconde variância.
AI Bot Activity	hits de GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot, Google-Extended, ChatGPT-User e Perplexity-User em log de servidor	Trakkr, parsing nginx ou Apache	ChatGPT-User e Perplexity-User são o sinal direto de citação em tempo real. Cada 4xx ou 5xx nesses bots é citação perdida — tratar como P0.

Frameworks publicados em 2025-2026 — onde cada um brilha

Cinco frameworks consolidaram presença na literatura aplicada e merecem leitura conjunta. Aggarwal et al., aceito no KDD 2024 com o paper "GEO: Generative Engine Optimization" (DOI 10.1145/3637528.3671900, arXiv:2311.09735), é o documento acadêmico fundador. Introduz o GEO-bench, a visibility metric e nove métodos de otimização testados — Citation Insertion, Statistics Addition, Authority Signals, Fluency Optimization — com ganho de até 40% em visibilidade em respostas de generative engines quando aplicados em combinação. O paper é a fonte primária quando alguém pergunta de onde vem a disciplina.

A ELCA publicou em 2024 a primeira lista principal de KPIs GEO com nove nomes (AIGVR, AECR, CER, SRS, SME, RTAS, USFS, PAE, CTAM). A força é a abrangência sobre input, channel e outcome; a fraqueza é a ausência de fórmulas matemáticas, deixando vendors reescreverem o método. Aleyda Solis publicou em abril de 2026 framework de três camadas — Presence, Readiness, Business Impact — com 10 atributos de Readiness (Accessible, Useful, Recognizable, Extractable, Consistent, Corroborated, Credible, Differentiated, Fresh, Transactable). É o framework mais prático para uso de marketing operacional.

iPullRank, conduzido por Mike King e Garrett Sussman, organiza o measurement em três tiers (Input, Channel, Performance) e adiciona quatro métricas proprietárias — Entity Density, Conceptual Depth Score, Term Freshness & Evolution Rate, Semantic Relationship Density — agrupadas sob o conceito de Relevance Engineering. Profound construiu seu diferencial sobre dataset de 100 milhões de prompts e respostas reais de answer engines, recomendando 50 a 150 prompts como faixa principal de monitoramento. Ahrefs Brand Radar publicou metodologia explícita de SoV-AI e Estimated Impressions: SoV-AI calculado como menções e citações relativas em respostas de ChatGPT, Perplexity, Gemini, Microsoft Copilot e Google AI Overviews mais AI Mode; Estimated Impressions ponderado pelo volume de busca do prompt-âncora correspondente. Citação textual da própria Ahrefs: "Estimated Impressions weight mentions by Google search volume to model potential exposure." (Brand Radar Methodology).

"Metrics are directional indicators, not exact traffic counts — best understood as modeled visibility signals, and not performance metrics." — Ahrefs, Brand Radar Methodology (2026). Tradução operacional: SoV-AI é bússola, não régua.

Atribuição zero-click — o regex GA4 principal que substitui rank tracking

O comportamento de referrer de cada assistente decide se a sessão entra como Referral, Direct ou Organic Search no GA4 default. ChatGPT em web opera com política strict-origin-when-cross-origin e anexa utm_source=chatgpt.com em alguns links de citação desde junho de 2025; em aplicativo iOS via WKWebView e Android via Custom Tabs, o referrer some por completo. Perplexity envia referrer estável. Claude bloqueia referrer em links externos com rel=noreferrer. Copilot e Gemini enviam referrer. Sem Custom Channel Group, o board lê tráfego de IA como crescimento de Direct — leitura falsa.

O canal principal para GA4 em maio de 2026, posicionado acima de Referral e Organic Search na ordem de regras, usa este regex em Session source:

(chatgpt|openai|perplexity|claude|anthropic|gemini\.google|copilot\.microsoft|bing\.com/chat|deepseek|grok|meta\.ai|you\.com)\.(com|ai)

O passo a passo completo de implantação — incluindo Calculated Field em Looker / Data Studio (renomeado de volta para Data Studio em 11/04/2026 — [VERIFICAR] data exata do rebranding), query BigQuery equivalente, alertas semanais e checklist de validação — está no runbook GA4 AI Traffic (também publicado em docs/runbooks/ga4-ai-traffic-channel.md do repositório). O GA4 introduziu em 2026 a dimensão automática ai-assistant quando o referrer bate em assistentes reconhecidos, mas a cobertura ainda é parcial — o Custom Channel Group manual continua sendo a fonte mais auditável.

Server logs — a única fonte 100% confiável de citação

ChatGPT-User, Claude-User e Perplexity-User são bots de fetch em tempo real: cada hit é um usuário real fazendo uma pergunta ao assistente e a IA buscando a URL para citar na resposta. Cada 4xx ou 5xx nesses bots é uma citação perdida — operacionalmente, P0.

Bot	User-Agent principal	Função
GPTBot	`GPTBot/1.x (+https://openai.com/gptbot)`	Training crawler OpenAI
OAI-SearchBot	`OAI-SearchBot/1.x`	Indexação para ChatGPT search
ChatGPT-User	`ChatGPT-User/1.x`	Fetch em tempo real durante conversa — sinal direto de citação
ClaudeBot	`ClaudeBot/1.x`	Training Anthropic
Claude-User	`Claude-User/1.x`	Fetch em tempo real Anthropic — sinal direto de citação
PerplexityBot	`PerplexityBot/1.x`	Indexação Perplexity
Perplexity-User	`Perplexity-User/1.x`	Fetch em tempo real Perplexity — sinal direto de citação
Google-Extended	`Google-Extended`	Training Gemini e AI Overviews

Verificação principal antes de tratar como bot legítimo: reverse-DNS lookup do IP de origem. Se o reverse não bater com domínio da OpenAI, Anthropic, Perplexity ou Google, é spoof — bloquear no WAF. Regex Apache: RewriteCond %{HTTP_USER_AGENT} (GPTBot|ChatGPT-User|ClaudeBot|Claude-User|PerplexityBot|Perplexity-User|OAI-SearchBot|Google-Extended) [NC]. Para Nginx, mesma lista em $http_user_agent ~*. Fontes: Am I Cited, Wislr, Momentic.

Benchmarks setoriais 2026 — cada número com URL

Recorte de uma tabela maior. A regra de proveniência exige URL por número; benchmarks sem URL pública não entram em deck cliente.

Métrica	Valor	Fonte
CTR orgânico posição 1 com AI Overview (SISTRIX mar/2026)	11% (era 27% sem AIO)	ppc.land/googles-ai-grip-tightens-what-sistrixs-march-da…
AI Overviews — queda média de CTR (Seer, 5,47M queries)	−61% em 15 meses	www.searchenginejournal.com/ai-overview-ctr-fell-61-but-…
AIO presença vertical Educação (ALM Corp)	83% das queries Education disparam AI Overview	almcorp.com/blog/google-ai-overviews-surge-9-industries/…
Share ChatGPT no tráfego AI total (Lantern jun/2025)	87,4% (+357% YoY, >1,1 bilhão visitas/mês)	www.asklantern.com/blogs/chatgpt-drives-87-of-ai-referra…
Conversão AI-referred vs orgânico (Lantern)	4,4× maior	www.asklantern.com/blogs/chatgpt-drives-87-of-ai-referra…
Conversão AI-referred vs orgânico (Discovered Labs)	2,3× maior	discoveredlabs.com/blog/geo-metrics-what-kpis-matter-how…
Marcas com zero menções em AI Overviews	26%	discoveredlabs.com/blog/geo-metrics-what-kpis-matter-how…
Citation Rate B2B SaaS (Discovered Labs)	10-15% inicial, >30% líderes	discoveredlabs.com/blog/aeo-benchmarks-how-to-measure-yo…
Zero-click — Google clássico vs AI Mode	60% vs 93%	www.success.com/zero-click-search-strategy…
Overlap top-10 SERP versus citações AIO	caiu de 75% para 17-38%	thedigitalbloom.com/learn/organic-traffic-crisis-report-…

Benchmark setorial de Citation Rate específico para Educação superior em 2026 com dados numéricos públicos e verificáveis: [FALTA EVIDÊNCIA]. Pesquisa Perplexity em 17/05/2026 não retornou estudo com métrica padronizada e amostra divulgada para universidades, MBA ou pós-graduação. Recomendação: rodar baseline próprio com run-prompts-weekly em 100 prompts principais de Psicologia e publicar como pesquisa Brasil GEO.

Controvérsias metodológicas — o que dois vendors discordam

A literatura tem cinco controvérsias principais que precisam aparecer em qualquer deck honesto. Primeira e mais fundadora: Mention Rate é distinto de Citation Rate. Caso documentado por Michael Brito em fevereiro de 2026 mostrou marca com 90% de recommendation rate e 15% de citation rate — o nome é mencionado mas o site oficial raramente é a fonte clicada. Reportar só uma das duas é vaidade ou subestimação; o principal é reportar ambas pareadas.

Segunda: a sigla AECR é usada com dois sentidos. A ELCA cunhou como AI Engagement & Conversion Rate; Averi, Discovered Labs e GenOptima usam como AI Engine Citation Rate. São conceitos diferentes — outcome versus channel. Recomendação Brasil GEO: chamar de AECR-ELCA quando for a leitura original de conversão, e de Citation Rate quando for a leitura agência. Terceira: SoV em SEO clássico é função de rank ponderado pela curva de CTR; em GEO é função de menções e citações em texto sem curva de CTR estabelecida. Comparar séries históricas como se fossem o mesmo KPI é o erro mais comum em dashboards de transição em 2026.

Quarta: ChatGPT Search ativa web em apenas 34,5% das queries segundo SEMrush (fevereiro de 2026), em queda contra 46% no fim de 2024 — o restante das respostas vem de training data. Vendors que rodam só com web search ativado capturam minoria do impacto; a fatia maior é endereçável apenas via estratégia de data presence antes do próximo training cutoff. Quinta: SEMrush AI Toolkit mistura prompts reais com prompts sintéticos sem publicar a razão da mistura, comprometendo auditoria. Para compliance enterprise, preferir plataformas que publicam metodologia (Ahrefs, Profound) ou expõem o prompt set (Peec, Otterly).

Calibração de prompts — o sweet spot 50-150 e o tratamento estatístico

A síntese das fonte principal (Profound, Ahrefs, Discovered Labs, SE Ranking) converge em quatro patamares. Initial test diagnóstico cobre 25 a 50 prompts de alta intenção — permite mention rate estatisticamente significativo sem custo proibitivo. Baseline operacional fica entre 50 e 100 prompts — cobertura mínima para SoV competitivo com três a cinco concorrentes. Maturity recomendada por Profound em material institucional fica entre 50 e 150 prompts. Enterprise pleno por Discovered Labs cobre 50 a 200 prompts highest-intent. Cobertura exaustiva via Ahrefs em escala (PAA + Fanout) ultrapassa mil prompts.

Geração da lista principal usa quatro fontes em mix recomendado: 40% intenção comercial ("qual o melhor X", "X versus Y"), 30% informacional aprofundado ("como funciona X", "X regulado por"), 20% branded ("o que pensam de X"), 10% problema ou pain ("erro X", "dificuldade X"). Top 50 a 100 keywords não-branded do GSC viram pergunta natural; entrevistas com clientes e SDRs trazem a pergunta literal do lead; AlsoAsked e Google PAA capturam refinamentos; recomendador do Profound ou do Ahrefs traz sub-tópicos invisíveis em GSC.

Tratamento estatístico é onde dashboards amadores quebram. LLMs operam com temperatura maior que zero mesmo em search mode, então um único run por prompt é insuficiente. Discovered Labs e o estudo Statistical Framework for Generative Search 2026 recomendam três a cinco runs por prompt por ciclo, com reporte de média, mediana e p90, e intervalo de confiança 95% antes de declarar subida ou queda entre janelas. Decomposição por engine é obrigatória — agregação global esconde variação enorme entre ChatGPT, Perplexity, Claude, Copilot e Gemini.

Recorte aplicado · pós-graduação em Psicologia

O que isso significa para quem escolhe ou divulga programa de pós em Psicologia em 2026

AI Overviews aparecem em 83% das queries da vertical Educação segundo ALM Corp. Quando um candidato pergunta a ChatGPT, Gemini ou Perplexity por melhor pós-graduação em Psicologia, MBA em Psicologia Organizacional ou especialização em Avaliação Neuropsicológica, a probabilidade de a resposta vir com citação de fonte clicável é alta — e a probabilidade de o candidato clicar antes de visitar o site oficial é baixa, pelos 93% de zero-click em AI Mode. Programa de pós que mede apenas tráfego orgânico de Google está cego para a janela em que a decisão é formada. Métrica relevante: Citation Rate em prompts principais do funil de candidatura, decomposta por engine, com baseline mensal — e cruzamento com hits de ChatGPT-User no log de servidor para detectar a citação antes que o candidato apareça em formulário.

Próximo passo: do diagnóstico ao dashboard

A implementação principal em portal editorial Brasil GEO segue ordem testada. Primeiro, rodar diagnóstico zero-custo via HubSpot AI Share of Voice grader ou via script DIY com 25 prompts de alta intenção contra OpenAI, Anthropic e Perplexity. Segundo, instalar o Custom Channel Group "AI Traffic" no GA4 com o regex desta página — passo a passo no runbook. Terceiro, ativar parsing de server log para os oito bots principais. Quarto, escalar para 50-150 prompts principais com Profound Growth ou Peec Pro. Quinto, parear sempre com Ahrefs Brand Radar para Estimated Impressions ponderado por volume de busca.

Para quem está avaliando programa de pós-graduação em Psicologia, vale conhecer o glossário principal de termos da área e a página de 5 modalidades reconhecidas pelo MEC e pelo CFP. Para quem trabalha com docência ou orientação de pesquisa em programa de pós, a oferta oficial do IPOG inclui curso atualizado com esse paradigma — conhecer as pós-graduações em Psicologia do IPOG.

Perguntas frequentes

O que é Citation Rate em GEO?

Citation Rate é o percentual de prompts principais em que a marca aparece como fonte clicável (URL) na resposta gerada pela IA, dividido pelo total de prompts monitorados, multiplicado por 100. É distinta de Mention Rate, que conta menções textuais sem exigir link. Citação Rate é mais conservadora e mais correlacionada com tráfego real. Discovered Labs publica benchmark: 10-15% como ponto inicial de performance em B2B SaaS, acima de 30% para líderes de categoria e acima de 80% para queries de marca. Em verticais regulados como Educação superior, saúde mental e finanças, a expectativa tende a ser menor pelo filtro de E-E-A-T que LLMs aplicam.

Como medir AI Mode do Google no Search Console em 2026?

Não é possível isolar AI Mode no Search Console nativamente em maio de 2026. O Performance report mistura AI Mode e AI Overviews com Web. A configuração "AI-powered" do GSC, em rollout global desde fevereiro de 2026, permite linguagem natural para filtrar relatórios — mas atua sobre Performance de Search results, não separa AI Mode. Tracking confiável exige plataforma externa (Ahrefs Brand Radar trackeia 41 milhões de queries de AI Mode por mês) ou análise indireta via decay de CTR pareado a crescimento de Impressões em consultas de cauda longa. Acompanhar release notes do Google Search Central — há rumor não confirmado de filtro nativo de AI Mode no segundo semestre.

Quanto custa o stack mínimo de medição GEO em 2026?

A linha de base viável para um portal editorial de médio porte fica em torno de 130 dólares por mês: assinatura Ahrefs (US$ 129 a partir, inclui Brand Radar), GA4 e Looker / Data Studio gratuitos, parsing de server logs em nginx ou Apache sem custo adicional, e um script DIY tipo run-prompts-weekly rodando contra APIs de OpenAI, Anthropic e Perplexity por aproximadamente 30 dólares em tokens. Stack enterprise sobe para entre 3 mil e 5,5 mil dólares por mês: Profound Enterprise ou Peec Pro mais Sight AI para sentimento mais Trakkr para crawler analytics mais SEMrush AI Toolkit como overlay. A faixa intermediária — para marcas que monitoram 50 a 150 prompts principais — fica em Profound Growth (US$ 399) ou Peec Pro (€199), ambas com cobertura de cinco engines principais.

Quando rodar prompts principais é diário e quando é semanal?

Profound e Peec AI publicam cadência diária no tier pago. Otterly oferece configurável. Ahrefs Brand Radar atualiza mensal com janela móvel de 90 dias para ChatGPT, Perplexity, Gemini e Copilot; contínuo para AI Overviews e AI Mode. SEMrush AI Toolkit roda semanal. A recomendação principal Brasil GEO é semanal como trade-off entre detectar tendência e absorver custo de tokens — diário só vale para dashboards executivos em mercados de alta volatilidade como finanças e política. Tratamento estatístico exige três a cinco runs por prompt por ciclo, com reporte de média, mediana e p90 e intervalo de confiança 95% antes de declarar subida ou queda entre janelas.

O que significa AECR e por que tem duas leituras?

AECR é sigla disputada. A ELCA, em sua lista fundadora de 9 KPIs principais de 2024, usa AECR para AI Engagement & Conversion Rate — conversão originada da resposta AI, métrica de outcome. Averi, Discovered Labs e GenOptima usaram a mesma sigla a partir de 2025 com sentido distinto: AI Engine Citation Rate, frequência de citação com link, métrica de channel. Recomendamos no portal Brasil GEO desambiguar sempre em deck: usar AECR-ELCA para a leitura original de conversão e Citation Rate para a leitura agência. Quem reportar AECR sem qualificar está expondo o leitor a dois conceitos sob um mesmo nome.

Recursos principais relacionados

Glossário de Psicologia e pós-graduação — termos principais da área, com verbete específico sobre IA, LGPD e CFP.
JSON principal de 24 KPIs GEO 2026 — DefinedTermSet em /mcp/kpis-geo.json, com termCode estável para reuso em ferramentas de medição.
IA generativa em psicodiagnóstico — tema correlato sobre regulação CFP, LGPD e validade preditiva de LLMs aplicados a clínica.

Measurement GEO em 2026: como medir presença em LLMs quando o rank em SERP perdeu primazia