fedorthinks
Todas las notas

BUSINESS · 3 de julio de 2026

El modelo se volvió commodity. El chip no.

Durante dos años todo el juego fue qué modelo es el más listo. Ese juego se está acabando: Claude Sonnet 5 aterrizó cerca de la calidad de la clase Opus por una fracción del precio, los labs compiten en coste en lugar de en IQ, y cambiar de proveedor ahora es un cambio de configuración. Cuando la capa de capacidad se vuelve commodity, el foso resbala hacia abajo por la pila — hacia el silicio de inferencia y los racks. OpenAI acaba de fabricar su propio chip. Esto es lo que significa para el resto de nosotros que construimos encima: el suelo de tu precio por token lo fijan dos capas más arriba, gente que nunca conocerás, así que diseña en consecuencia.

El modelo se volvió commodity. El chip no.

Mira en qué compiten de verdad los labs este trimestre. No en "el nuestro razona y el suyo no". Es el precio. Claude Sonnet 5 salió con una calidad agéntica cercana a la clase Opus por 3 $ por millón de tokens de entrada frente a los 5 $ de Opus — y ahora es el predeterminado. Los modelos de frontera están convergiendo en "lo bastante bueno para casi todo", las diferencias entre ellos se encogen, y — como no paro de decir — cambiar uno por otro es un cambio de configuración, no una reescritura.

Así es como se ve la mercantilización. Y cuando la capa que todos obsesionaban se convierte en una commodity, el dinero interesante se mueve a otro sitio.

Cuando la cima de la pila se aplana, el foso baja por ella

Bajó al silicio. Días antes de Sonnet 5, OpenAI y Broadcom presentaron Jalapeño, el primer chip de inferencia personalizado de OpenAIun acelerador construido desde cero para inferencia de LLM, orientado a exprimir un rendimiento por vatio mucho mejor. Eso no es un proyecto de vanidad. Es un reconocimiento de que si el modelo es una commodity, la ventaja duradera está en servirlo más barato que nadie — lo que significa poseer el chip, el rack, el contrato eléctrico y la asignación de fábrica.

El modelo nunca fue tu foso. En 2026 dejó de ser también el foso del lab. El foso es quienquiera que pueda ejecutar inferencia por una décima de céntimo menos — y eso se decide en una fundición, no en un prompt.

Qué significa eso si construyes encima

Estás alquilando cómputo a gente que ahora está en una carrera armamentística por poseer la capa física. Tú no controlas el chip, el datacenter, ni el precio que ponen encima de ellos. Así que deja de fingir que el precio del token es una entrada fija y empieza a tratarlo como la variable volátil, controlada aguas arriba, que es:

  • Ajusta el tamaño sin descanso. El predeterminado debería ser el modelo más pequeño que supere el listón, no el más grande que haya disponible. Recurre primero al modelo pequeño y reserva el caro para las llamadas que de verdad lo necesitan.
  • Enruta por dificultad, cachea por defecto. Modelo barato para el 90%, modelo potente para el 10% difícil, y una caché delante para que nunca pagues dos veces por la misma respuesta. El coste es una decisión de arquitectura, no una sorpresa en la factura.
  • Mantén dos proveedores calientes. La portabilidad no es solo un seguro contra que un modelo desaparezca — es cómo persigues el sustrato adecuado más barato a medida que se desarrolla la guerra de precios. Encadenado a un solo proveedor, te comes el margen que necesite este trimestre.
  • Posee las partes que no se vuelven commodity. Tus datos, tus evals, tu producto, tu criterio. El chip y el modelo se están convirtiendo en utilidades intercambiables. Lo que construyes alrededor de ellos es lo único que no lo es.

En resumen

La era de "qué modelo es el más listo" se está cerrando, y la reemplaza una pelea sobre quién puede servir inteligencia más barato — librada en fábricas y datacenters en los que no tienes asiento. No pasa nada. No necesitas un asiento. Necesitas construir como si la cosa que estás alquilando fuera una commodity con un precio que no fijas tú.

Trata el modelo como intercambiable y el precio del token como el clima aguas arriba. Ajusta el tamaño, enruta, cachea, mantente portable — y vierte tu foso en la capa por encima de la commodity, porque esa es la única capa que es tuya.

Comentarios

Aún no hay comentarios

Inicia sesión para unirte a la conversación.

Sé el primero en compartir una idea.