'O apocalipse da IA': como a internet pode entrar em um ciclo de autossabotagem informacional

Esqueça os data centers consumindo água ou a substituição de trabalhadores: para uma pesquisa, um dos maiores problemas dos grandes modelos de linguagem (LLMs, na sigla em inglês), é o fato de que as respostas feitas por inteligência artificial (IA) ficarão cada vez mais similares.
Segundo a Graphite, plataforma de revisão de código, quando a IA começa a buscar, na web, textos que ela mesma escreveu, as respostas "colapsam" e convergem para uma única versão, repetida quase palavra por palavra.
O fenômeno foi batizado de colapso de busca da IA(AI search collapse) e descrito em um relatório publicado em 16 de junho pela Graphite, empresa americana de pesquisa em marketing e conteúdo.
Em mais de 1.500 simulações, os pesquisadores encontraram colapso em 79,6% dos casos — um índice que acende um alerta sobre o futuro da informação online.
O que é o colapso de busca da IA?
Para entender o problema, é preciso saber como a IA responde hoje.
Sistemas como o ChatGPT usam uma técnica chamada geração aumentada por recuperação (RAG, na sigla em inglês). Antes de responder, o modelo faz uma busca na internet e usa os textos encontrados como base. Em tese, isso deveria fazer a resposta espelhar a diversidade de opiniões da web.
O problema é que a IA hoje também escreve boa parte desses comentários. Em estudo anterior, a própria Graphite mostrou que já se publicam tantos artigos gerados por IA quanto escritos por humanos.
Quando o modelo busca e encontra textos que ele mesmo produziu — as chamadas referências autorais (self-authored) —, cria-se um ciclo de retroalimentação: a IA aprende com a IA, que aprende com a IA, até que as respostas percam variedade e travem em uma única versão.
Basta uma única referência para travar tudo
A descoberta mais surpreendente do estudo é a rapidez do efeito.
Os pesquisadores esperavam que o colapso só acontecesse quando muitas referências fossem substituídas por conteúdo de IA. Mas não. Basta uma única referência autoral para que o colapso comece quase imediatamente.
Em um dos experimentos, no início das simulações, apenas 22% dos pares de respostas eram praticamente iguais. Ao fim do processo, 89% tinham virado paráfrases umas das outras.
Entidades que antes apareciam em todas as respostas — como certos nomes em uma lista dos melhores videogames — simplesmente sumiam, enquanto outras passavam a aparecer sempre, sem que houvesse uma razão clara além do próprio ciclo de retroalimentação.
A IA prefere o que a própria IA escreveu
Por que uma única referência tem tanto poder?
O estudo aponta para um fenômeno que chama de viés de autopreferência (self-bias): a IA tende a preferir textos escritos por ela mesma, em seu próprio estilo.
Os números são expressivos — referências autorais foram citadas em 38,9% das vezes, contra cerca de 7% a 9% das referências originais, escritas por humanos ou por outras IAs.
Os pesquisadores testaram se isso seria apenas porque os textos da própria IA eram de melhor qualidade.
Mesmo controlando estatisticamente esse fator, o viés se manteve: ser "autoraçal" adicionava cerca de 26 pontos percentuais à taxa de citação de um texto, enquanto ser apenas "gerado por IA" (mas por outro modelo) não fazia diferença.
Ou seja, não é que a IA goste de conteúdo de IA em geral, ela gosta especificamente do seu próprio conteúdo.
O fenômeno aparece em vários modelos
Para checar se o problema era específico de uma empresa, o estudo rodou as simulações em três dos principais modelos do mercado: o GPT-5.2, da OpenAI; o Gemini 3 Pro, do Google; e o Claude Sonnet 4.5, daAnthropic.
O colapso apareceu nos três — com algumas variações de intensidade, mas presente em todos —, o que indica que não se trata de uma falha pontual de um produto, e sim de uma característica mais ampla da forma como esses sistemas funcionam.
Ao todo, foram 1.019 perguntas diferentes, três tipos de simulação e mais de um milhão de chamadas às interfaces de programação (APIs) dos modelos.
Por que isso importa para quem usa IA
O risco central que o estudo aponta é a perda de pluralidade.
Se as respostas da IA deixam de refletir a diversidade de pensamento que existe na internet e passam a convergir para uma só perspectiva, o usuário que faz uma pergunta recebe uma visão cada vez mais estreita do mundo — sem saber que outras respostas, igualmente válidas, foram silenciosamente descartadas pelo ciclo.
Há um dado que dá concretude à preocupação: segundo o estudo, 42,7% das referências citadas pelo ChatGPT em junho de 2026 já eram, possivelmente, geradas por IA, contra 38,9% em janeiro do mesmo ano. Oterreno para o colapso, em outras palavras, já está sendo preparado.
Dá para evitar?
Os autores — Gregory Druck, diretor de IA da Graphite, e Ethan Smith, presidente-executivo da empresa — apontam possíveis soluções, ainda que nenhuma seja garantida.
Entre elas, filtrar conteúdo gerado por IA na hora da busca, diversificar os resultados para eliminar quase duplicatas e instruir o modelo a valorizar a diversidade ou a recorrer ao próprio conhecimento interno em vez de depender só da busca.
O estudo reconhece limites: as simulações não provam que o colapso já esteja acontecendo em larga escala nos produtos comerciais, e é possível que as empresas já tenham mecanismos para conter o problema.
Mas, em um cenário em que produzir conteúdo com IA ficou barato e rápido, a tendência é que a fatia de texto artificial na internet só cresça — e, com ela, o risco de que a web, aos poucos, vire um eco do que a própria máquina já disse.
