Análisis · Coste de la IA

El problema del margen bruto de la IA: por qué sus márgenes de software se reducen

El software clásico tenía un coste marginal casi nulo: una vez construido, servir a un cliente más no costaba casi nada, razón por la que los márgenes brutos de SaaS estaban en el 70 a 85 por ciento. La IA rompe eso. Cada consulta cuesta compute, así que una función de IA lleva un coste de mercancía que escala con el uso. Inversores y CFO ven ahora los márgenes brutos de software derivar hacia la franja del 50 a 60 por ciento, con la inferencia sola reportada en torno a una quinta parte de los ingresos en empresas de IA a escala. El margen del 80 por ciento se está volviendo la excepción. Defender el margen depende ahora de conocer los unit economics de cada función de IA.

El reset del margen
70-85%
margen bruto que definió el SaaS clásico, con coste marginal casi nulo.
a16z, benchmarks del sector
~52%
margen bruto medio reportado de empresas AI-first, a medida que el COGS de compute escala con el uso.
ICONIQ vía secundario, 2026
~23%
parte de los ingresos consumida solo por la inferencia en empresas de IA a escala, antes de otros COGS.
ICONIQ vía Monetizely, 2026

Las cifras de ~52% y ~23% provienen de información secundaria de un conjunto de datos de ICONIQ; confírmelas en el primario antes de citarlas en un entregable de cliente. La dirección estructural, que la IA añade COGS real y comprime el margen, está bien establecida.

Por qué cae el margen

La causa es simple: las funciones de IA tienen un coste de mercancía que el software no tenía. Cada uso gasta tokens, y las funciones de razonamiento y agénticas gastan muchos. Ese coste se sitúa en el COGS y tira del margen bruto hacia abajo. El efecto es desigual, porque más barato por token no significa más barato por función: a medida que los modelos se abaratan, los productos los usan más, así que el coste de mercancía puede mantenerse o subir aunque bajen los precios por token. El resultado es un reset estructural, con analistas proyectando un nuevo suelo muy por debajo del antiguo benchmark de SaaS, salvo que la empresa ejecute una stack de inferencia inusualmente disciplinada.

Cómo defenderlo

La defensa del margen empieza en los unit economics: el coste de servir un uso de cada función de IA, frente al precio o valor que genera. Con esa cifra puede hacer tres cosas. Reprecificar funciones cuyo plan fijo pierde dinero con usuarios intensivos, incluido pasar a precio por uso o por resultado. Re-ingeniar el coste de servir enrutando peticiones baratas a modelos pequeños y cacheando contexto. Y retirar las funciones cuyo coste de servir nunca se cubrirá. Nada de esto es posible desde un margen agregado; exige costear la IA al nivel de un solo resultado, que es para lo que se hizo el costeo basado en actividades.

EL RESET DEL MARGEN, VISUALIZADO

Ilustrativo. El margen bruto del SaaS clásico estaba en el 70 a 85 por ciento, con coste marginal casi nulo. Las empresas AI-first operan más cerca del 52 por ciento, con la inferencia sola consumiendo en torno al 23 por ciento de los ingresos. Las proporciones son ilustrativas.

El margen del 80 por ciento del software se basaba en un coste marginal de cero. La IA puso un contador en cada uso, y el contador está ahora en su coste de mercancía.

Preguntas frecuentes

¿Por qué los márgenes brutos de la IA son más bajos que los del SaaS?
Porque las funciones de IA llevan un coste de mercancía que el software clásico no tenía. Cada consulta gasta compute, así que cuanto más se usa la función, más cuesta servirla. El SaaS clásico tenía coste marginal casi nulo y operaba al 70 a 85 por ciento de margen bruto; las empresas AI-first se reportan más cerca del 50 a 60 por ciento, con la inferencia sola consumiendo en torno a una quinta parte de los ingresos a escala.
¿Se acabó el margen bruto del 80 por ciento del SaaS?
Para software con funciones de IA pesadas, los analistas esperan un suelo estructuralmente más bajo, a menudo citado en la franja del 50 a 70 por ciento, porque el coste de inferencia se sitúa ahora en el coste de mercancía. Empresas con uso ligero de IA o una stack de inferencia muy disciplinada pueden mantenerse más altas. El punto es que el 80 por ciento ya no es el valor por defecto una vez que la IA está incrustada.
¿Cómo protegemos el margen bruto en las funciones de IA?
Gestionando los unit economics. Mida el coste de servir un uso de cada función, compárelo con el precio o valor que genera, luego reprecifique las funciones que pierden dinero con usuarios intensivos, re-ingenie el coste de servir con enrutamiento y caché, y retire las funciones que nunca cubrirán su coste. Esto exige costear la IA al nivel de un resultado, no de un promedio agregado.
¿La IA más barata resuelve el problema del margen?
No por sí sola. El precio por token ha caído mucho, pero los productos responden usando más IA y recurriendo a razonamiento y agentes ávidos de tokens, así que el coste de mercancía a menudo se mantiene o sube aunque bajen los precios por token. El margen se protege gestionando cuánta IA consume una función por unidad de valor, no esperando a que los tokens se abaraten.

Defienda su margen con unit economics reales de IA.

El Profit Check muestra dónde se fuga el margen, IA incluida, en cinco minutos.

Hacer el Profit Check
M
Pregúntanos lo que quieras
suele responder en minutos
Hola. Aquí mismo respondo las preguntas rápidas sobre coste, método y plazos. Para algo específico de tu negocio, te paso con Miguel por WhatsApp.
Gratis. Sin bucles de bot. Directo a una persona.