Quanto custa correr agentes de IA?

Muito mais por tarefa do que uma única chamada ao modelo. Os agentes re-enviam contexto acumulado e percorrem muitos passos e chamadas a ferramentas, consumindo cinco a trinta vezes mais tokens por tarefa do que um chatbot, segundo estimativas do setor. O custo depende também da frequência com que o agente tem sucesso: as tentativas falhadas também são pagas. O único número fiável é o seu custo por tarefa concluída, medido em traces reais.

Porque é que os agentes de IA são tão mais caros do que um chatbot?

Porque um chatbot responde em cerca de uma chamada, enquanto um agente planeia, chama ferramentas, lê resultados e raciocina ao longo de muitos passos, re-enviando o contexto a cada vez. O contexto re-enviado pode ser a maior parte da fatura. Os modelos de raciocínio mais novos geram ainda tokens extra antes de responder. O custo compõe com o comprimento da tarefa.

O que é o custo por tarefa concluída?

É o custo total de tokens, ferramentas e revisão humana de concluir uma tarefa, incluindo as tentativas que falharam antes de ter sucesso, a dividir pela taxa de sucesso. É a unidade honesta de custo de um agente, porque capta as repetições e a supervisão que um número de custo por token ignora.

Como devemos orçamentar a IA agêntica?

Orçamente por tarefa, não por token. Estime o custo de uma tarefa concluída para cada caso de uso do agente, multiplique pelo volume esperado, e acrescente uma margem para a taxa de falha e a revisão humana. Depois confronte esse número com o valor que a tarefa cria. É o Time-Driven Activity-Based Costing aplicado a agentes, e é como evita uma surpresa no fim do trimestre.

Análise · Custo da IA

Porque a IA agêntica custa até 30x mais, e como orçamentá-la

Um agente de IA não é uma única chamada ao modelo. É uma cadeia delas: o agente planeia, chama uma ferramenta, lê o resultado, re-envia o contexto acumulado, raciocina de novo e repete até a tarefa estar feita. Cada ciclo paga todo o contexto anterior, por isso uma tarefa que um chatbot responde numa chamada pode custar a um agente muitas vezes mais. Segundo uma estimativa da EY, uma interação agêntica orquestrada em 2026 pode custar cerca de trinta vezes um workflow simples de 2023. O número que importa não é o preço por token; é o custo de uma tarefa concluída.

Custo do agente, numa linha

Custo por tarefa = Σ ao longo dos passos de (tokens nesse passo × preço) + chamadas a ferramentas e retrieval + revisão humana, tudo a dividir pela taxa de sucesso da tarefa.

Porque os agentes são diferentes

5-30×

mais tokens por tarefa do que uma única chamada de chatbot, porque os agentes re-enviam o contexto acumulado a cada passo.

EY, 2026

~1,20 $

custo estimado de uma interação agêntica orquestrada em 2026, face a uns cêntimos de um workflow linear de 2023.

EY, 2026

por tarefa

a unidade de custo certa é uma tarefa concluída e validada, não um token nem uma chamada.

Consenso de prática, 2026

Os números são atribuídos e ilustrativos da direção; confirme nas suas próprias traces de agente antes de orçamentar. O ponto estrutural, que o contexto é re-enviado e por isso o custo compõe, não está em disputa.

Onde se esconde o custo

O maior driver escondido é o contexto re-enviado. A cada passo, um agente re-fornece tipicamente a conversa até ali, as definições das ferramentas e os resultados intermédios. No passo final de uma tarefa longa, a maioria dos tokens pagos não é trabalho novo, é o mesmo contexto enviado vezes sem conta. Os analistas estimam que o contexto re-enviado pode ser a maior parte da fatura de um agente. Junte o custo das chamadas a ferramentas, do retrieval e dos tokens de raciocínio que os modelos mais novos geram antes de responder, e uma única tarefa abre-se em dezenas de chamadas pagas.

O segundo driver escondido é a falha. Um agente que conclui uma tarefa à segunda ou terceira tentativa pagou também as tentativas falhadas. Se uma classe de tarefa só tem sucesso 60 por cento das vezes, o custo real por tarefa concluída é o custo das tentativas a dividir por 0,6, mais o tempo humano de verificar e repetir. Uma visão de custo por token nunca vê isto; uma visão de custo por tarefa concluída coloca-o em destaque.

Porque o preço fixo quebra

Como o custo do agente é variável e movido pela tarefa, qualquer feature de IA vendida a preço fixo mensal carrega risco de margem assim que chega um utilizador intensivo. Ao longo de 2025, vários fornecedores de ferramentas de programação abandonaram os planos fixos por esta razão exata: um utilizador intensivo a correr um agente o dia todo podia consumir muito mais do que a subscrição cobria. A lição para qualquer empresa que embeba agentes é que o preço da feature e o custo da feature têm de ser desenhados em conjunto, o que exige saber o custo por tarefa antes de fixar o preço.

COMO O CUSTO DO AGENTE COMPÕE A CADA PASSO

Ilustrativo. Cada passo re-envia o contexto anterior, por isso o custo em tokens de uma tarefa multi-passo cresce mais depressa do que o número de passos. As tentativas falhadas antes de um sucesso também são pagas.

Com um agente, não paga por resposta. Paga por tentativa, e o contexto está no contador a cada passo.

Perguntas frequentes

Quanto custa correr agentes de IA?: Muito mais por tarefa do que uma única chamada ao modelo. Os agentes re-enviam contexto acumulado e percorrem muitos passos e chamadas a ferramentas, consumindo cinco a trinta vezes mais tokens por tarefa do que um chatbot, segundo estimativas do setor. O custo depende também da frequência com que o agente tem sucesso: as tentativas falhadas também são pagas. O único número fiável é o seu custo por tarefa concluída, medido em traces reais.
Porque é que os agentes de IA são tão mais caros do que um chatbot?: Porque um chatbot responde em cerca de uma chamada, enquanto um agente planeia, chama ferramentas, lê resultados e raciocina ao longo de muitos passos, re-enviando o contexto a cada vez. O contexto re-enviado pode ser a maior parte da fatura. Os modelos de raciocínio mais novos geram ainda tokens extra antes de responder. O custo compõe com o comprimento da tarefa.
O que é o custo por tarefa concluída?: É o custo total de tokens, ferramentas e revisão humana de concluir uma tarefa, incluindo as tentativas que falharam antes de ter sucesso, a dividir pela taxa de sucesso. É a unidade honesta de custo de um agente, porque capta as repetições e a supervisão que um número de custo por token ignora.
Como devemos orçamentar a IA agêntica?: Orçamente por tarefa, não por token. Estime o custo de uma tarefa concluída para cada caso de uso do agente, multiplique pelo volume esperado, e acrescente uma margem para a taxa de falha e a revisão humana. Depois confronte esse número com o valor que a tarefa cria. É o Time-Driven Activity-Based Costing aplicado a agentes, e é como evita uma surpresa no fim do trimestre.

Continuar a explorar

Saiba quanto custam os seus agentes de IA por tarefa.

O Profit Check mostra onde o seu custo de servir, agentes incluídos, está escondido, em cinco minutos.

Fazer o Profit Check

Porque a IA agêntica custa até 30x mais, e como orçamentá-la

Perguntas frequentes

O verdadeiro custo da IA

TDABC para o custo da IA

A curva da baleia da rentabilidade

Saiba quanto custam os seus agentes de IA por tarefa.

Continue a explorar

Curva da Baleia

Custo-de-Servir

Caso de Estudo: Distribuidor NZ

Não sabe onde se encaixa?