Pular para o conteúdo principal
Sacre Investimentos
Inteligência ArtificialCMDT
29/06/2026
7 min

Tokens de IA: a moeda que pode virar o 'petróleo' da nova economia

Tokens de IA: a moeda que pode virar o 'petróleo' da nova economia

Toda vez que alguém faz uma pergunta a um modelo de inteligência artificial (IA), como o ChatGPT ou o Claude, o pedido é fatiado em pequenas unidades chamadas tokens, pedaços de texto que equivalem, em média, a cerca de quatro caracteres cada. Esses tokens são a moeda de troca da IA — é por eles que se cobra, se mede o consumo e se calcula o custo de operar a tecnologia.

Agora, essa unidade invisível começou a se comportar como uma commodity, quase como o petróleo. Tem preço de mercado, oferta apertada, cotação em queda e até proposta de contratos futuros para negociá-la.

O que era apenas uma régua técnica de cobrança virou objeto de estudo econômico — e, segundo pesquisadores, está a caminho de se tornar a primeira mercadoria nascida inteiramente na era da IA.

O que faz de um token uma commodity?

Na economia, uma commodity é um produto padronizado e substituível, em que uma unidade não se distingue de outra e pode ser negociada em larga escala.

Os tokens cumprem esses requisitos, segundo um artigo publicado na plataforma de preprints arXiv.

O estudo lista três condições.

A primeira é a substituibilidade. Quando um aplicativo envia um pedido a um modelo, o que conta é a qualidade e a velocidade da resposta, não qual placa de vídeo a gerou — o que torna tokens de capacidade equivalentes, de fornecedores como OpenAI, Anthropic ou Google, intercambiáveis.

Essa substituibilidade não é total, mas os autores fazem um paralelo: o petróleo dos tipos WTI, Brent e Dubai varia em qualidade, e isso não impede o funcionamento de um mercado de futuros de óleo.

A segunda é a medida padronizada. Cobrar por "milhão de tokens" virou convenção universal do setor, do mesmo modo que a energia é medida em quilowatt-hora e o gás natural em milhões de BTUs.

A terceira é a escala. Segundo dados da Universidade de Stanford citados no estudo, o mercado global de interfaces de programação (APIs) de inferência passou de US$ 10 bilhões por ano em 2024, com crescimento superior a 100% ao ano — patamar comparável ao do mercado de créditos de carbono em seus primeiros anos.

Matéria-prima e produto ao mesmo tempo

O argumento central do estudo é que o token tem uma natureza dupla, rara entre as mercadorias tradicionais.

De um lado, é matéria-prima.

Uma empresa de software precisa "consumir" tokens para gerar respostas aos clientes, da mesma forma que uma indústria consome aço ou etileno — um insumo cujo custo define a margem do produto final.

De outro, é produto acabado.

Para o usuário final, o token é o serviço entregue, como a água que sai da torneira ou a eletricidade na tomada.

Segundo os autores, à medida que a IA deixa de ser apenas um "chatbot" e passa a executar tarefas no mundo real, o lado matéria-prima tende a dominar — repetindo a trajetória da eletricidade, que saiu de novidade no fim do século 19 para virar infraestrutura básica em meados do século 20.

O paralelo com a eletricidade

Entre todas as comparações, a mais próxima, segundo o estudo, é com a eletricidade.

Os tokens dividem com a energia elétrica duas características. Uma delas é a não estocabilidade — não há como guardar tokens produzidos hoje para usar amanhã — e a rigidez de oferta, já que gerá-los depende de uma infraestrutura de chips e energia que não se expande no curto prazo.

Esse vínculo com o mundo físico é o que leva os autores a classificar os tokens como commodity, e não como ativo financeiro.

Por trás de cada token há consumo de processamento e de eletricidade.

O presidente-executivo da Nvidia, Jensen Huang, tem repetido em teleconferências de resultados que a métrica central para os data centers é a de tokens de inferência por watt.

O estudo aponta ainda um predecessor direto do token: a computação em nuvem vendida por hora, como as instâncias da Amazon — o token seria uma versão mais padronizada e granular dessa mesma lógica.

O preço está em queda

Como commodity, o token tem preço — e ele está em queda.

Usando como referência a capacidade do GPT-4, o estudo calcula que o custo da inferência caiu de cerca de US$ 60 por milhão de tokens no início de 2023 para menos de US$ 1,5 no início de 2025, uma redução de mais de 40 vezes em dois anos.

As projeções apontam para a continuidade do movimento.

Segundo o Goldman Sachs, os fornecedores de semicondutores entregam reduções de custo por token de 60% a 70% ao ano na inferência, puxadas por chips mais eficientes e por novas arquiteturas de data center.

Já a Gartner afirma que até 2030, processar uma resposta em um modelo de um trilhão de parâmetros deve custar aos provedores de IA mais de 90% menos do que custava em 2025. A consultoria passou a usar a expressão "deflação dos tokens commoditizados" para nomear o fenômeno.

O estudo explica a queda por um modelo de três fatores que se multiplicam.

O custo de energia, a eficiência dos chips — limitada pela Nvidia, dona de mais de 80% do mercado, com ciclos de 18 a 24 meses entre gerações — e a eficiência dos algoritmos, o fator que avança mais rápido e de forma mais imprevisível.

Como os três melhoraram ao mesmo tempo nos últimos anos, o preço despencou.

O paradoxo: token mais barato, conta mais cara

Mas há uma contradição.

Mesmo com o preço unitário do token em queda, a conta total da IA aumenta — e a explicação é matemática: o consumo de tokens cresce mais rápido do que o preço cai.

O motor desse consumo é a IA agêntica, em que agentes autônomos não só respondem a uma pergunta, mas raciocinam em etapas, dividem tarefas e se autocorrigem.

Segundo a Gartner, esse tipo de modelo usa de 5 a 30 vezes mais tokens por tarefa do que um chatbot tradicional.

O Goldman Sachs projeta que o consumo global de tokens vai se multiplicar por 24 entre 2026 e 2030, chegando a 120 quatrilhões de tokens por mês.

O efeito já aparece na conta de quem usa. Quando o GitHub passou a cobrar o Copilot por consumo de tokens, em vez de um número fixo de pedidos, usuários relataram ter esgotado os créditos de um mês inteiro em poucas horas.

Segundo a FinOps Foundation, entidade que reúne profissionais de gestão financeira de tecnologia, o orçamento médio de IA de uma grande empresa passou de US$ 1,2 milhão por ano em 2024 para US$ 7 milhões em 2026, com a inferência respondendo pela maior parte do gasto.

A armadilha da 'commoditização'

Por isso, a Gartner alerta para o que chama de "armadilha da commoditização".

O preço da unidade básica cai, mas a capacidade de processamento necessária para o raciocínio mais avançado segue escassa e cara. Ter tokens baratos não equivale a ter IA barata, do mesmo modo que petróleo barato não baratearia automaticamente tudo o que depende dele.

O valor, segundo a consultoria, tende a migrar para quem souber orquestrar diferentes modelos — enviando tarefas simples e de alto volume para modelos menores, e reservando os de fronteira para o que exige mais raciocínio.

Falta o mercado para fechar a analogia

Se o token já se comporta como commodity no consumo e no preço, falta uma peça para completar o paralelo com o petróleo: um mercado organizado para negociá-lo.

É o que propõe o estudo, com contratos futuros padronizados que permitiriam às empresas se protegerem da variação de preços — uma simulação citada no trabalho indica que o mecanismo poderia reduzir a oscilação de custo de computação das empresas entre 62% e 78%.

Os autores estimam a janela de lançamento desse mercado entre 2027 e 2028, quando a expansão das aplicações de IA deve mudar a relação entre oferta e demanda. Por ora, a resposta à pergunta é um "quase".

Os tokens já têm preço, padronização e escala de uma commodity — falta a bolsa onde possam ser negociados como uma.

AutorTamires Vitorio
FonteExame
Distribuído por