Análise · Custo da IA

O problema da margem bruta da IA: porque as suas margens de software estão a encolher

O software clássico tinha custo marginal quase nulo: uma vez construído, servir mais um cliente custava quase nada, razão pela qual as margens brutas de SaaS ficavam nos 70 a 85 por cento. A IA quebra isso. Cada consulta custa compute, por isso uma feature de IA carrega um custo de mercadoria que escala com o uso. Investidores e CFOs veem agora as margens brutas de software a derivar para a faixa dos 50 a 60 por cento, com a inferência sozinha reportada em cerca de um quinto da receita nas empresas de IA em escala. A margem de 80 por cento está a tornar-se a exceção. Defender a margem depende agora de conhecer os unit economics de cada feature de IA.

O reset da margem
70-85%
margem bruta que definiu o SaaS clássico, com custo marginal quase nulo.
a16z, benchmarks do setor
~52%
margem bruta média reportada de empresas AI-first, à medida que o COGS de compute escala com o uso.
ICONIQ via secundário, 2026
~23%
parte da receita consumida só pela inferência em empresas de IA em escala, antes de outros COGS.
ICONIQ via Monetizely, 2026

Os valores de ~52% e ~23% vêm de reporte secundário de um dataset da ICONIQ; confirme no primário antes de citar num deliverable de cliente. A direção estrutural, que a IA acrescenta COGS real e comprime margem, está bem estabelecida.

Porque a margem cai

A causa é simples: as features de IA têm um custo de mercadoria que o software não tinha. Cada uso gasta tokens, e as features de raciocínio e agênticas gastam muitos. Esse custo fica no COGS e puxa a margem bruta para baixo. O efeito é desigual, porque mais barato por token não significa mais barato por feature: à medida que os modelos ficam mais baratos, os produtos usam-nos mais, por isso o custo de mercadoria pode manter-se ou subir mesmo com os preços por token a cair. O resultado é um reset estrutural, com analistas a projetar um novo piso bem abaixo do antigo benchmark de SaaS, a não ser que a empresa corra uma stack de inferência invulgarmente disciplinada.

Como defendê-la

A defesa da margem começa nos unit economics: o custo de servir um uso de cada feature de IA, face ao preço ou valor que rende. Com esse número pode fazer três coisas. Reprecificar features cujo plano fixo dá prejuízo com utilizadores intensivos, incluindo passar a preço por uso ou por outcome. Re-engenheirar o custo de servir encaminhando pedidos baratos para modelos pequenos e fazendo cache de contexto. E cortar as features cujo custo de servir nunca será coberto. Nada disto é possível a partir de uma margem agregada; exige custear a IA ao nível de um único resultado, que é o que o custeio baseado em atividades foi feito para fazer.

O RESET DA MARGEM, VISUALIZADO

Ilustrativo. A margem bruta do SaaS clássico ficava nos 70 a 85 por cento, com custo marginal quase nulo. As empresas AI-first correm mais perto dos 52 por cento, com a inferência sozinha a consumir cerca de 23 por cento da receita. As proporções são ilustrativas.

A margem de 80 por cento do software assentava num custo marginal de zero. A IA pôs um contador em cada uso, e o contador está agora no seu custo de mercadoria.

Perguntas frequentes

Porque são as margens brutas da IA mais baixas do que as do SaaS?
Porque as features de IA carregam um custo de mercadoria que o software clássico não tinha. Cada consulta gasta compute, por isso quanto mais a feature é usada, mais custa a servir. O SaaS clássico tinha custo marginal quase nulo e corria a 70 a 85 por cento de margem bruta; as empresas AI-first são reportadas mais perto dos 50 a 60 por cento, com a inferência sozinha a consumir cerca de um quinto da receita em escala.
Acabou a margem bruta de 80 por cento do SaaS?
Para software com features de IA pesadas, os analistas esperam um piso estruturalmente mais baixo, muitas vezes citado na faixa dos 50 a 70 por cento, porque o custo de inferência fica agora no custo de mercadoria. Empresas com uso ligeiro de IA ou uma stack de inferência muito disciplinada podem manter-se mais altas. O ponto é que 80 por cento já não é o default quando a IA está embebida.
Como protegemos a margem bruta nas features de IA?
Gerindo os unit economics. Meça o custo de servir um uso de cada feature, compare com o preço ou valor que rende, depois reprecifique as features que dão prejuízo com utilizadores intensivos, re-engenheire o custo de servir com encaminhamento e cache, e reforme as features que nunca cobrirão o seu custo. Isto exige custear a IA ao nível de um resultado, não de uma média agregada.
IA mais barata resolve o problema da margem?
Não por si só. O preço por token caiu muito, mas os produtos respondem usando mais IA e recorrendo a raciocínio e agentes esfomeados de tokens, por isso o custo de mercadoria muitas vezes mantém-se ou sobe mesmo com os preços por token a cair. A margem protege-se gerindo quanta IA uma feature consome por unidade de valor, não esperando que os tokens fiquem mais baratos.

Defenda a sua margem com unit economics reais de IA.

O Profit Check mostra onde a margem está a fugir, IA incluída, em cinco minutos.

Fazer o Profit Check
M
Pergunte-nos o que quiser
costuma responder em minutos
Olá. Respondo aqui mesmo às perguntas rápidas sobre custo, método e prazos. Para algo específico do seu negócio, passo-o ao Miguel no WhatsApp.
Grátis. Sem voltas de robô. Direto a uma pessoa.