O verdadeiro custo da IA é um custo unitário. Quase ninguém mede.
O custo da IA numa empresa não é a fatura da API. É o custo total de produzir um resultado de IA útil, depois de contar a inferência, a capacidade das GPUs por trás, dados e integração, revisão humana, repetições e governança. O preço por token caiu cerca de dez vezes por ano, mas as faturas de IA das empresas estão subindo, porque os modelos de raciocínio e os agentes consomem muito mais tokens por tarefa. As empresas que vão ganhar a próxima fase são as que conseguem responder a uma pergunta enganosamente simples: quanto custa, de fato, uma unidade da nossa IA, e dá lucro entregá-la?
Em resumo
Contabilidade de carbono e contabilidade de custos partilham um método. O preço por token despenca, mas a fatura total sobe porque cada tarefa consome muito mais tokens (o efeito Jevons). Custeie o resultado de IA pela sua causa, com o TDABC, e descobre quais casos de uso dão lucro e quais drenam margem. A IA deixa de ser uma despesa que ninguém entende e passa a ser uma decisão de lucratividade.
O custo da IA é um iceberg
Ilustrativo. O preço da API por token é a ponta visível. Abaixo da superfície estão o custo de capacidade das GPUs (boa parte ociosa), a preparação de dados e a integração, a revisão humana que valida o resultado da IA, as repetições e a governança. Uma demonstração de resultados padrão não mostra nada disto como custo da IA.
Há uma contradição no centro da conversa sobre IA. Estudos patrocinados por fornecedores relatam vários dólares de retorno por cada dólar gasto, enquanto a pesquisa independente conclui que a maioria das organizações não consegue apontar nenhum efeito no resultado. As duas coisas podem ser verdade ao mesmo tempo, pela mesma razão: o retorno da IA é muito alegado e raramente medido. Quando ninguém custeou um único resultado de IA, ninguém consegue dizer se compensa. Esta lacuna não é um problema de tecnologia. É um problema de contabilidade de custos, e é precisamente esse que existimos para resolver.
O fato pior compreendido sobre o custo da IA é que tokens mais baratos não significam faturas menores. O preço de gerar um token de uma dada qualidade colapsou, uma tendência que a a16z chamou de LLMflation. Mas tokens mais baratos convidam a um uso muito mais intensivo de tokens. Um fluxo linear simples de 2023 podia custar uns centavos por interação; um sistema agêntico orquestrado em 2026, com ferramentas, ciclos de raciocínio e contexto reenviado, pode custar mais de um dólar pela mesma interação, cerca de trinta vezes mais segundo uma estimativa da EY. É o clássico efeito Jevons: quando um recurso fica mais barato por unidade, o consumo total pode crescer mais rápido do que o preço cai.
O custeio por atividades baseado no tempo (TDABC) foi feito exatamente para isto. O custo de um resultado de IA é a soma de: tokens vezes preço por token, mais GPU-segundos vezes a taxa de capacidade prática, mais minutos de revisão humana vezes o custo carregado, mais o overhead de repetições e governança. A contribuição líquida é o valor do resultado menos esse custo. Quando se constrói isto por caso de uso, aparece uma curva da baleia da IA: alguns casos de uso pagam muito bem, muitos ficam no zero a zero, e uma cauda destrói margem em silêncio. Sem este número, a IA é fé; com ele, é gestão.
Aprofundar
Quanto custa, de fato, a sua IA?
Comece com um diagnóstico de lucratividade e descubra quais casos de uso de IA compensam.
Falar connosco