Estado-da-arte de GEO em 2026 — papers, frameworks e mudanças principais

Tese contraintuitiva: em 2026, ranquear no Google deixou de garantir ser citado por IA

A tese organizadora deste documento é simples e desconfortável: o trabalho de SEO clássico, que durante quinze anos foi suficiente para captar tráfego qualificado, virou condição necessária e não mais suficiente. Dois dados resolvem a discussão. Primeiro: o overlap entre as dez primeiras posições do Google e as fontes citadas em AI Overviews caiu de 75% em meados de 2025 para uma faixa entre 17% e 38% no início de 2026, dependendo da vertical e do engine medido. Segundo: o AI Mode do Google entrega 93% de queries zero-click contra 60% do Google clássico — o usuário que antes clicava no resultado orgânico hoje recebe a resposta na própria interface, com no máximo três links inline.

A consequência operacional é que ranquear em primeiro lugar para uma query informacional deixou de ser a meta. A meta nova é ser absorvido — ter trechos, definições, tabelas e números migrados para dentro da resposta gerada, com atribuição idealmente clicável. Para o portal Brasil GEO e para qualquer marca brasileira que dependa de visibilidade orgânica, isso muda quem precisa estar sentado à mesa quando o conteúdo é planejado: o engenheiro de schema, o autor com bylines principais e o operador de measurement entram junto com o redator e o estrategista de palavras-chave.

As 12 mudanças principais que estruturam este documento foram destiladas de cinco dossiês paralelos de pesquisa (Waves A-E), que somaram 203 sources e 70+ confirmações individuais via WebFetch em 2026-05-17. A base principal completa está em docs/governance/seo-geo-knowledge-base-2026-05-17.md deste repositório.

1. Oito papers que organizam o campo

Cada paper abaixo foi spot-checked individualmente via WebFetch em 2026-05-17. Título, autores e URL principal confirmados na fonte primária — arXiv ou repositório institucional.

1. GEO: Generative Engine Optimization

2311.09735

Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan e Deshpande, 2024 (KDD)

Achado: Paper fundador do campo. Introduz "Generative Engine Optimization" como paradigma, propõe o GEO-bench (10 mil queries) e demonstra que reescritas com estatísticas, citações e fontes autoritativas elevam impressão score em até 40-41%.

Relevância para o portal: Toda a literatura subsequente cita este trabalho como ponto zero. É a referências principais para discutir GEO em material institucional.

Abrir fonte primária

2. Impact of AI Search Summaries on Website Traffic: Evidence from Google AI Overviews and Wikipedia

2602.18455

Khosravi e Yoganarasimhan, 2026

Achado: Estudo causal com diff-in-diff: exposição às AI Overviews reduziu o tráfego diário da Wikipedia em inglês em aproximadamente 15%. Categoria Cultura caiu mais do que STEM. Edições não expostas (incluindo Wikipedia em pt-BR durante a janela do estudo) serviram de controle.

Relevância para o portal: Primeira evidência empírica forte do efeito de canibalização das AIO sobre tráfego orgânico — base para tese de descolamento SEO × GEO.

Abrir fonte primária

3. From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms

2604.25707

Zhang, He e Yao, 2026

Achado: Distingue formalmente Citation Selection (a plataforma escolhe a fonte) de Citation Absorption (a fonte contribui linguagem, evidência ou estrutura para a resposta gerada). Mostra que páginas com alta absorção são mais longas, melhor estruturadas e ricas em evidência extraível (números, tabelas, definições, passos).

Relevância para o portal: Reframe principal do KPI de citação. Ser citado no painel lateral não é o mesmo que ter conteúdo absorvido na resposta.

Abrir fonte primária

4. Mapping hallucinated citations in 2025 academic literature

2605.07723

Zhao et al., 2026

Achado: Catalogou 146.932 citações alucinadas em literatura acadêmica durante 2025 — DOIs gerados por LLMs que apontam para artigos inexistentes, autores trocados, anos errados. [VERIFICAR — número macro retido como ordem de grandeza principal das waves de pesquisa interna.]

Relevância para o portal: Justifica disciplina operacional: nunca aceitar DOI gerado por Opus, Sonnet, GPT-4o ou Gemini sem validar com WebFetch ou Perplexity em fonte primária.

Abrir fonte primária

5. Generative Engine Optimization: How to Dominate AI Search

2509.08919

Chen, Wang, Chen e Koudas, 2025

Achado: Experimentos controlados em larga escala mostram que AI Search exibe viés sistemático e massivo a favor de earned media (fontes terceiras autoritativas) em comparação ao comportamento mais equilibrado do Google clássico. ChatGPT favorece marcas populares; Perplexity menciona mais marcas por resposta; Google AIO tem maior diversidade; Copilot tem maior desigualdade.

Relevância para o portal: Implica que branding direto via SEO próprio é insuficiente — investir em earned media (imprensa, podcasts, parcerias acadêmicas) virou alavanca primária para citação por LLM.

Abrir fonte primária

6. Structured linked data as memory layer for retrieval-augmented generation

2603.10700

Volpini et al., 2026

Achado: Schema.org markup denso aumenta a probabilidade de uma página servir como camada de memória para LLMs em RAG, com ganho relativo de até 29,6% em recuperação de entidades em testes controlados. [VERIFICAR — número específico retido das waves internas; ordem de grandeza coerente com literatura paralela.]

Relevância para o portal: Reforça a tese do @graph triplo (Organization + Person + Article) com @id principal e sameAs cross-platform como alavanca subestimada.

Abrir fonte primária

7. Correctness is not Faithfulness in Retrieval Augmented Generation Attributions

DOI 10.1145/3731120.3744592

Wallat et al., ICTIR 2025

Achado: Distinção formal entre Citation Correctness (a fonte citada de fato suporta a afirmação) e Citation Faithfulness (a afirmação foi gerada A PARTIR da fonte, não pós-racionalizada da memória paramétrica). Afirmações que vêm da memória interna do modelo não deveriam carregar citação.

Relevância para o portal: Nova subárea formal de measurement. Implica que dois LLMs podem ter a mesma "Citation Rate" e qualidades radicalmente diferentes — precisamos medir faithfulness, não só presença.

Abrir fonte primária

8. How Generative AI Disrupts Search: An Empirical Study of Google Search, Gemini, and AI Overviews

2604.27790

Grossman, Liu, Chen, Smith, Borcea e Chen, 2026

Achado: AIOs aparecem em mais de 50% das queries em vertical sensível como Educação Superior e Saúde, mas a consistência entre duas execuções idênticas da mesma query é baixa — pequenas edições na query mudam significativamente a resposta. Engines respondem de modo robusto a paráfrase em alguns domínios e frágil em outros.

Relevância para o portal: Justifica 3-5 runs por prompt no baseline próprio e por engine — uma única observação por prompt é estatisticamente insuficiente em 2026.

Abrir fonte primária

2. Cinco framework de referência de mensuração

Cada framework atende a uma audiência distinta — escolha conforme o stakeholder principal do seu painel.

Framework	Origem	Foco	Quando usar
ELCA — 9 KPIs principais	ELCA, 2024	Mention Rate, Citation Rate, SoV-AI, AECR-Conversion, AECR-Citation, AIGVR, NSS, Hallucination Rate, AI-Referred Traffic	Painel unificado para reportar resultados a stakeholders C-level.
iPullRank 3-tier	Mike King, 2025-2026	Presença (a marca aparece?), Posição (em que slot?), Desempenho (gera negócio?). Três níveis hierárquicos.	Estrutura de relatório executivo simples e auditável.
Aleyda 3-layer	Aleyda Solís, SEOFOMO, 2026	Presence Layer (ser visto), Readiness Layer (estar pronto tecnicamente — schema, llms.txt, robots), Business Impact Layer (tráfego AI-referred, conversão).	Diagnóstico cross-funcional entre time editorial, técnico e comercial.
Profound data-driven	Profound, 2025-2026	Visibility Score proprietário com base em 100M+ queries observadas, segmentado por engine e por vertical.	Benchmark competitivo de alto nível em mercados onde a Profound já tem cobertura.
Aggarwal GEO-bench	Aggarwal et al., KDD 2024	10 mil queries × múltiplos domínios; nove heurísticas de reescrita de conteúdo testadas em condições controladas.	Benchmark acadêmico replicável — base para validar uma intervenção antes de escalar.

Arraste a tabela para ver mais colunas.

3. Comportamento engine-by-engine em maio de 2026

Não existe uma estratégia universal — cada motor tem comportamento distinto que altera prioridades editoriais e técnicas.

ChatGPT (OpenAI)

Estado em 2026: GPT-5.3 Instant default desde 04/03/2026 cita marcas em 8% das respostas; GPT-5.4 Thinking cita em 56%. Diferença de tier altera dramaticamente probabilidade de menção. Domínios únicos citados caíram 20% em 5 semanas após mudança de default.

Consequência operacional: Tracking semanal é insuficiente em janelas de transição de modelo — diário pelo menos durante release window.

Google AI Mode + AI Overviews

Estado em 2026: Rodando em pt-BR no Brasil desde 08/09/2025 com Gemini 2.5 customizado para Search. Mudanças de 06/05/2026 introduziram links inline próximos ao texto, hover preview e subscription highlight. AI Overviews aparecem em mais de 50% das queries em verticais como Educação Superior. CTR posição 1 com AIO presente caiu de 27% para 11%.

Consequência operacional: O canal já é dominante para pós-graduação no Brasil — não é cenário futuro. Schema + Speakable + tabela HTML extraível são pré-requisitos.

Perplexity

Estado em 2026: Sonar Deep Research roda Claude Opus 4.5 desde 04/2026 como modelo de fundo, com Citations API que não conta tokens. Comet Browser global em mar/2026 (iOS, Android, Mac, Windows). PerplexityBot foi delistado dos Verified Bots da Cloudflare em ago/2025 por crawler stealth.

Consequência operacional: Bloquear PerplexityBot via UA não basta — combinar com Cloudflare Bot Management ou rate-limit por ASN se a decisão for limitar acesso.

Claude (Anthropic)

Estado em 2026: Opus 4.7 GA em 16/04/2026; web_search tool com Citations API que não conta tokens. Skills + Connectors Directory unificado em claude.ai/directory. Forte apetite por by-lines e Person principal no @graph.

Consequência operacional: Trabalhar author bylines e schema Person com sameAs robusto é alavanca de citação para Claude maior do que para ChatGPT.

Microsoft Copilot / Bing

Estado em 2026: AI Performance Report em public preview no Bing Webmaster Tools desde 10/02/2026 — única fonte oficial gratuita de citation tracking por URL para Copilot. IndexNow continua sendo o canal principal de notificação rápida (Google não participa).

Consequência operacional: Habilitar Bing Webmaster Tools com AI Performance Report é hygiene obrigatória — custo zero, observabilidade exclusiva.

4. Standards técnicos em 2026 — o que entra e o que sai do stack

O padrão consolidado em 2026 é o Schema.org @graph triplo com Organization + Person + Article cross-referenciados via @id ancorado em URL fragment. A release 30.0 do Schema.org saiu em 19/03/2026. O Person principal com sameAs apontando para Wikipedia, Wikidata e LinkedIn é a alavanca subestimada de entity recognition mais consistente entre todos os engines testados — tem efeito particularmente forte em Claude e Gemini, e ganho marginal em ChatGPT.

O FAQPage perdeu o rich result em SERP em 07/05/2026 mas o markup migrou de função — passou a ser correlacionado com aproximadamente 3,2 vezes mais probabilidade de citação em AI Overviews. Continue marcando FAQ. Sete schemas foram descontinuados em janeiro de 2026 — ClaimReview, EstimatedSalary, LearningVideo, SpecialAnnouncement, VehicleListing, PracticeProblem e um sétimo de menor relevância — todos perderam rich result e devem ser retirados do template.

MCP (Model Context Protocol) virou padrão de fato em 2026 — spec 2025-11-25 doada em dezembro de 2025 para a Agentic AI Foundation no Linux Foundation. Em contrapartida, ai-plugin.json, ai-context.json e ai-agents.json estão mortos ou nunca chegaram a virar padrões — não publique. llms.txt continua sem evidência estatística de impacto sobre Citation Rate em estudo de cerca de 300 mil domínios (apenas 408 hits diretos em 500 milhões de visitas de bots de IA). Publique como hygiene de baixo custo, nunca como linha principal de investimento.

IndexNow segue como canal principal de notificação rápida — Bing, Yandex, Naver, Seznam e Yep participam; Google não participa. O Web Bot Auth (draft IETF Meunier 2026) e o Cloudflare Pay Per Crawl (HTTP 402 + JWT, mais de 1 bilhão de 402/dia em maio de 2026) são alavancas de defesa para quem quer monetizar ou limitar crawl de IA. O PerplexityBot foi delistado dos Verified Bots da Cloudflare em agosto de 2025 por comportamento stealth — bloquear UA não basta, combine com Bot Management ou rate-limit por ASN.

5. Mudança de canal em pt-BR: por que YouTube + LinkedIn batem Reddit no Brasil

A diferença mais consequente entre os playbooks americano e brasileiro está no mix de canal social que alimenta as citações em AI Overviews. Em queries pt-BR, o YouTube concentra 65% das citações sociais em AIO; o Reddit despenca para 7%; o Instagram triplica para 17%. Em queries en-US o quadro é praticamente inverso — YouTube por volta de 16%, Reddit em torno de 30%.

A implicação operacional é direta. Marcas brasileiras que importaram cego o playbook de Reddit americano (community building, AMAs, posts em subreddits de nicho) estão sub-investindo no canal que de fato move o ponteiro no Brasil. O canal #1 é YouTube com transcript clean, chapter markers e descrição longa — o LLM lê a transcrição e cita o vídeo como fonte com timestamp. O canal #2 é LinkedIn Pulse com 500 a 2000 palavras por post, cinco ou mais posts por mês por autor. Instagram entra em terceiro lugar com alt-text robusto e legendas descritivas — não esqueça que o motor lê o texto, não a imagem.

Esse dado, isolado, justifica realocação de pelo menos um terço do investimento em conteúdo orgânico de marcas brasileiras em 2026. Para o portal Brasil GEO, o canal principal de distribuição de cada pillar é YouTube em primeiro lugar, LinkedIn em segundo e Instagram em terceiro — Reddit fica fora do top 3.

6. Gaps estruturais brasileiros — três oportunidades de ocupação

Gap 1: analista brasileiro principal. Nenhum analista brasileiro publica semanalmente sobre GEO com cadência editorial comparável a Aleyda Solís (SEOFOMO, 40 mil assinantes, 45% open rate), Mike King (iPullRank), Lily Ray (Amsive), Rand Fishkin (SparkToro) ou Marie Haynes. O espaço para uma newsletter semanal pt-BR principal em GEO está vazio — Alexandre Caramaschi pode ocupá-lo com Brasil GEO.

Gap 2: evento brasileiro dedicado. Não há evento brasileiro em 2026 com track 100% dedicado a GEO. iMasters tem tangências, RD Summit não publica track formal, AEO Conf San Francisco e SMX Munich seguem como referência internacional. Há espaço para Brasil GEO patrocinar ou curar um track próprio em conferência consolidada (HSM, RD Summit, MaxConference) ou criar evento dedicado em formato single-track.

Gap 3: benchmark principal vertical educação superior pt-BR. Toda a literatura empírica disponível é em inglês americano (en-US) ou inglês indiano (en-IN). Nenhuma plataforma global publica baseline pt-BR para educação superior. Brasil GEO está endereçando este gap com baseline próprio em 2026.Q3, descrito em detalhe na página de benchmarks Brasil GEO (link interno abaixo).

Perguntas frequentes

Por que SEO deixou de ser igual a GEO em 2026?

O overlap entre as top 10 posições orgânicas do Google e as fontes citadas em AI Overviews caiu de 75% em meados de 2025 para 17-38% no início de 2026 (Wave C §7 da KB interna; comportamento confirmado em Chen, Wang, Chen e Koudas, 2025, arXiv 2509.08919). Ranquear em primeiro lugar continua valioso para o tráfego clássico, mas não garante mais ser citado pelo motor generativo. O canal AI Mode entrega 93% de queries zero-click contra 60% do Google clássico — a métrica que importa muda de "cliques" para "menções e absorção".

FAQPage perdeu o rich result. Continua valendo a pena marcar?

Sim. O FAQPage perdeu o rich result em SERP no dia 07/05/2026, mas o markup migrou de função: passou a ser correlacionado com cerca de 3,2 vezes mais probabilidade de citação em AI Overviews em medições recentes da Wave D interna. Continue marcando FAQ com FAQPage e Speakable, valide em validator.schema.org (não no Rich Results Test, que parou de exibir FAQ) e estruture perguntas com a forma direta da query do usuário.

Como medir mention rate em ChatGPT, Gemini e Perplexity no Brasil em 2026?

Em ordem de maturidade: começa-se com um script próprio (run-prompts-weekly) executando 50 a 100 prompts principais × 5 engines × 3 a 5 runs por prompt, com mix 40% comercial + 30% informacional + 20% branded + 10% pain. Para escala, plataformas como Otterly Lite (US$ 29/mês), Peec Pro (€199), Ahrefs Brand Radar (US$ 398-699 se já cliente Ahrefs) e Profound (US$ 399-5000+ enterprise). No Brasil, nenhuma das plataformas globais publica baseline pt-BR vertical educação superior — gap que o portal Brasil GEO está endereçando com baseline próprio em 2026.Q3.

llms.txt funciona como alavanca de citação?

Em estudo de cerca de 300 mil domínios com 500 milhões de visitas de bots de IA, foram observados apenas 408 hits diretos em llms.txt (Wave D §1.4-1.5 da KB; análise SE Ranking). Sem evidência estatística de impacto sobre Citation Rate. Publicar é hygiene de baixo custo — leva meia-tarde de trabalho. Não trate como linha principal e não invista esforço editorial significativo. Schema.org @graph triplo, FAQPage com Speakable e tabelas HTML extraíveis seguem sendo as três alavancas que mais movem o ponteiro.

Quais papers eu deveria ler nesta ordem em 2026?

Para começar e ter base principal: (1) Aggarwal et al., KDD 2024 (arXiv 2311.09735) — fundador, leia primeiro. (2) Chen, Wang, Chen e Koudas, 2025 (arXiv 2509.08919) — estado da arte aplicado, com viés de earned media. (3) Zhang, He e Yao, 2026 (arXiv 2604.25707) — Citation Selection vs Absorption como framework de medida. (4) Khosravi e Yoganarasimhan, 2026 (arXiv 2602.18455) — evidência causal sobre canibalização de tráfego. (5) Wallat et al., ICTIR 2025 — Correctness vs Faithfulness para entender por que duas métricas iguais podem esconder qualidades distintas. As waves A-E em docs/research/ deste repositório consolidam 203 referências e 70+ spot-checks individuais.

Próximo passo

Quem prepara o portal para esse cenário hoje colhe a primeira onda de captação 2027.1

Os três movimentos principais para 2026 são: (1) auditar o @graph triplo em todas as páginas, (2) rodar baseline próprio de mention rate e citation rate em 50 a 100 prompts × 5 engines × 3 runs e (3) decidir alocação de canal pt-BR com YouTube em primeiro lugar. Cada movimento abaixo tem um documento próprio neste portal.

Pillar próximo

Estado-da-arte de GEO em 2026: papers, frameworks e mudanças principais

Tese contraintuitiva: em 2026, ranquear no Google deixou de garantir ser citado por IA

1. Oito papers que organizam o campo

1. GEO: Generative Engine Optimization

2. Impact of AI Search Summaries on Website Traffic: Evidence from Google AI Overviews and Wikipedia

3. From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms

4. Mapping hallucinated citations in 2025 academic literature

5. Generative Engine Optimization: How to Dominate AI Search

6. Structured linked data as memory layer for retrieval-augmented generation

7. Correctness is not Faithfulness in Retrieval Augmented Generation Attributions

8. How Generative AI Disrupts Search: An Empirical Study of Google Search, Gemini, and AI Overviews

2. Cinco framework de referência de mensuração

3. Comportamento engine-by-engine em maio de 2026

ChatGPT (OpenAI)

Google AI Mode + AI Overviews

Perplexity

Claude (Anthropic)

Microsoft Copilot / Bing

4. Standards técnicos em 2026 — o que entra e o que sai do stack

5. Mudança de canal em pt-BR: por que YouTube + LinkedIn batem Reddit no Brasil

6. Gaps estruturais brasileiros — três oportunidades de ocupação

Perguntas frequentes

Quem prepara o portal para esse cenário hoje colhe a primeira onda de captação 2027.1

Benchmarks de GEO no Brasil — onde estamos em maio de 2026

Glossário principal GEO

Regulação, ética e escopo do portal

Sobre Alexandre Caramaschi e Brasil GEO

Atalhos de teclado