4 de junio de 2026
Llegó la factura
Durante dos años el costo de la IA se sintió como un error de redondeo. En 2026 llegó la factura — Uber quemó el presupuesto anual de IA en cuatro meses, Microsoft les quitó Claude Code a sus propios ingenieros, JPMorgan dice que los tokens se están comiendo las ganancias de internet. Esto no es un bache pasajero. La facturación por tokens invierte la economía sobre la que se construyó el software, y el giro cruel es que un agente mejor cuesta más. Esto es lo que realmente cambió, con honestidad.
Durante unos dos años, el costo de usar IA era algo en lo que no pensabas. En un demo eran centavos. En un pitch deck era una nota al pie. Todos construían como si la inteligencia de su producto fuera, a efectos prácticos, gratis — llamar al mejor modelo para todo, dejar que el agente itere todo lo que quiera, escalar primero y nunca preocuparse por la factura.
En 2026 llegó la factura, y no es una nota al pie.
El pánico por los costos es real
Las cifras de esta primavera dejaron de ser abstractas. Uber quemó todo su presupuesto anual de IA en cuatro meses. Microsoft revocó silenciosamente las licencias de Claude Code para la mayoría de sus propios ingenieros y los empujó a una herramienta interna más barata. Un consultor de IA le contó a Axios que uno de sus clientes gastó medio mil millones de dólares en un solo mes en Claude. JPMorgan publicó una nota con el alegre título de "Los costos de tokens de IA se están comiendo las ganancias de internet." Y solo el 14% de los CFOs dice que puede ver un retorno claro y medible sobre lo que está gastando.
La versión más cruda vino de un ejecutivo de Nvidia, citado mientras los costos de IA superaban la nómina: el costo del cómputo ahora está muy por encima del costo de los empleados. Detente a pensarlo. La herramienta pensada para abaratar a las personas se volvió más cara que las personas.
Por qué esto no es un bache pasajero
Sería reconfortante llamarlo un pico temporal — los precios bajarán, se resolverá solo. Los precios por token sí están bajando, y aun así no te va a salvar, porque el problema es estructural. La facturación por tokens invierte la economía sobre la que se construyó el software.
La magia del software era el costo marginal cercano a cero. Lo construyes una vez, y el usuario diez mil te cuesta casi nada más que el primero. Por eso funciona "escala ahora, monetiza después" — servir a más gente es casi gratis. La IA rompe eso. Cada uso quema tokens, así que el costo sube con el uso y nunca se aplana. Peor aún, un agente no es una sola llamada al modelo — itera, planifica, llama herramientas, reflexiona. La IA agéntica puede consumir hasta 1,000× más tokens que una consulta simple, y Goldman Sachs espera que los agentes impulsen un aumento de 24 veces en la demanda de tokens para 2030.
Aquí viene la parte que debería recablear tu forma de pensar: con los tokens, hacer al agente mejor a menudo lo hace costar más. Más razonamiento, más pasos, más contexto — más capacidad — son más tokens. El instinto habitual del software, "hacerlo más inteligente", ahora trae un medidor adjunto. Un análisis encontró que el impuesto de tokens se come el 23% de los ingresos en empresas de IA en etapa de escalamiento, fijando los márgenes brutos unos 30 puntos por debajo de la norma SaaS. Esa brecha no es un bug que optimizas para que desaparezca. Es la nueva física.
La parte que nos hicimos solos
Ahora la mitad honesta, porque el pánico no es solo el precio del modelo — buena parte es autoinfligida. Varias empresas incentivaron la quema de tokens. Meta y otras montaron tablas de clasificación internas que rankeaban a los empleados por cuántos tokens usaban, y la gente hizo lo racional: le tiraban todo a los agentes todo el día para subir en la tabla. Lo llamaron "tokenmaxxing", y produjo exactamente lo que medía: máximo gasto, no máximo valor. La firma de analítica Faros AI incluso encontró que bajo una adopción intensa de IA, el "code churn" (churn de código) — líneas escritas y luego borradas — saltó más del 800%. Muchos de esos tokens caros generaron código que fue tirado a la basura de inmediato.
Así que la factura son dos cosas apiladas: el costo real y estructural de la inferencia, y encima una falla de disciplina — tratar un recurso medido como si fuera gratis, e incluso premiar a la gente por desperdiciarlo.
Lo que realmente significa
Esto no es "la IA no funciona". Es "la IA nunca fue gratis, y construimos dos años de productos fingiendo que lo era". La corrección es saludable, y mata exactamente los hábitos correctos. El manual perezoso — apuntar el modelo más caro a todo, dejar que los agentes iteren sin límite, nunca mirar el medidor — es lo que está muriendo. Lo que lo reemplaza es la virtud más antigua de la ingeniería: la eficiencia, tratada como una característica en vez de como una ocurrencia tardía.
Y fíjate quién no está entrando en pánico. Los equipos que ya estaban enrutando el aburrido 90% del trabajo a modelos baratos, fundamentando para que el agente no queme tokens dando palos de ciego, y manteniendo a los agentes acotados en vez de dejar que un agente-dios itere para siempre — ellos lo metieron en el precio desde el principio, porque trataron los tokens como el costo real que siempre fueron. El pánico por los costos es, en su mayoría, un ajuste de cuentas para todos los que no lo hicieron.
La era de los demos baratos terminó. Cada producto de IA ahora tiene que responder la pregunta que debió haber respondido desde el principio: ¿vale esto los tokens que quema? Eso no es una crisis. Es simplemente la matemática apareciendo — un poco tarde, y muy fuerte.
Comentarios
Aún no hay comentarios
Inicia sesión para unirte a la conversación.
Sé el primero en compartir una idea.