BUSINESS · 10 de junio de 2026

Los “agentes gestionados” son cómodos hasta que no puedes irte

Google, Anthropic y otros están empujando la propuesta más fácil de la IA: una llamada a la API y nosotros corremos tu agente completo — el sandbox, las herramientas, la memoria, el estado — sobre nuestra infraestructura. Es genuinamente cómodo, y para un prototipo es estupendo. Pero fíjate en lo que acabas de entregar. Una API de modelo gestionado te renta el cerebro, que sigue siendo intercambiable. Un agente gestionado te renta todo el sistema nervioso de tu producto, y ese es un anzuelo mucho más profundo. Comodidad y lock-in son aquí la misma compra — y la cuenta llega después.

La propuesta más caliente de la IA ahora mismo es el agente gestionado. Google oficializó esta temporada los Managed Agents en la Gemini API: una llamada a la API levanta un agente en un sandbox aislado en la nube donde razona, planifica, llama herramientas, ejecuta código, gestiona archivos y mantiene estado — y la infraestructura de Google se encarga de todo, así que tú no aprovisionas nada. Anthropic lanzó sus propios Claude Managed Agents como una ventanilla única. La promesa es la misma en todas partes: sáltate la fontanería, lanza el agente en un día.

Es genuinamente cómodo, y no quiero pretender lo contrario. Para un prototipo, algo desechable, una cosa cuyo riesgo es bajo, un agente gestionado es un gran trato. Pero vale la pena tener claro qué estás comprando en realidad, porque comodidad y lock-in son, en este caso, exactamente la misma transacción — y el costo aparece mucho más tarde que la comodidad.

Ya no estás rentando un modelo. Estás rentando el sistema nervioso.

Aquí está la distinción que importa. Ya he escrito antes que un modelo detrás de una costura limpia sigue siendo intercambiable — rentas el cerebro, y puedes cambiar de cerebro con un valor de configuración. Un agente gestionado es otra compra. No estás rentando solo el modelo; estás rentando el runtime (donde el agente se ejecuta), la memoria y el estado (lo que recuerda entre ejecuciones), la capa de herramientas (cómo actúa) y la observabilidad (cómo ves lo que hizo). Eso no es un componente. Eso es el sistema operativo completo de tu producto, corriendo dentro de los muros de un solo proveedor.

Y a diferencia del modelo, esas partes se acumulan. Como lo pone el análisis de esta ola, terminas incrustando la arquitectura de tu agente en el runtime, la gobernanza y la observabilidad de la plataforma de formas que se acumulan con el tiempo y que se vuelven cada vez más difíciles de deshacer. Cuanto más tiempo corre, más memoria y comportamiento de tu producto viven en un lugar que no puedes llevarte fácilmente. Este es el problema del lock-in de contexto de hace unas semanas, empujado una capa más adentro: no solo tus datos, sino toda la máquina que actúa sobre ellos.

La prueba del 10%

Hay un dato brutal que vale la pena llevar en el bolsillo. Una evaluación de 2026 encontró que aproximadamente el 90% de los lanzamientos de "agentes" de IA son envoltorios de funciones controlados por el proveedor — carecen de estado persistente que tú controles, portabilidad de modelo y auditabilidad externa. Solo cerca del 10% son plataformas genuinas y portables donde el agente realmente puede correr de forma independiente de la infraestructura del proveedor.

Eso te da una prueba de fuego limpia para cualquier producto de agente gestionado: ¿puedes tomar la memoria, las herramientas y la definición de tu agente y correrlas en otro lugar? Si sí, es una plataforma real y la comodidad es gratis. Si no — si el cerebro, la memoria, las habilidades y el runtime de tu agente son todos del proveedor, sin exportación — entonces no es una plataforma, es una función con una tarifa de salida, y la tarifa es tu producto entero.

Úsalo por velocidad, desacopla lo que se acumula

Esto no es un argumento de "nunca uses agentes gestionados" — eso sería tonto, la velocidad es real. Es un argumento de "ten claro qué transacción estás haciendo". El patrón que usan los equipos más afilados es desacoplar del runtime del proveedor las partes que se acumulan: mantén la capa de memoria, la biblioteca de herramientas/habilidades y la orquestación en formatos que tú controles, para poder cambiar el runtime sin perder el estado acumulado de tu producto. Unas cuantas líneas prácticas:

Lo gestionado está bien para riesgo bajo y prototipos; desacopla cualquier cosa central. Cuanto más rápido te dolería no poder irte, menos de tu sistema nervioso debería vivir en el runtime del proveedor.
Sé dueño de tu memoria y tus herramientas. El estado acumulado de tu agente y sus definiciones de herramientas/habilidades son las partes con gravedad. Mantenlas exportables y en formatos abiertos — apoyándote en capas abiertas como MCP para las herramientas — para que no queden atrapadas en un solo runtime.
Aplica la misma prueba de salida que aplicarías a un modelo. No dejo de preguntarle a un proveedor: si mañana duplicaran el precio o cerraran el servicio, ¿cuánto tardaría en moverme? Pregúntaselo también al runtime del agente. Si la respuesta honesta es "no podríamos", no compraste comodidad — compraste una dependencia.
Vigila los datos, no solo el runtime. Los logs, las trazas y cualquier fine-tuning viven en algún lugar; si solo existen dentro del servicio gestionado sin exportación, eso es lock-in disfrazado de dashboard.

La conclusión

Los agentes gestionados son la oferta más seductora de la IA porque eliminan el trabajo más fastidioso — el runtime, la fontanería, la gestión de estado — con una sola llamada. Y precisamente por eso merecen una segunda mirada. La fontanería que eliminan es también la parte que, una vez llena de la memoria y el comportamiento de tu producto, no puedes recuperar sin reconstruirla.

Así que toma la comodidad donde el riesgo es bajo, y donde no lo es, recuerda qué estás entregando: no un modelo que puedes intercambiar, sino toda la máquina con la que piensa tu producto. Construye de modo que las partes que se acumulan — memoria, herramientas, orquestación — sean tuyas y portables, y deja que el proveedor corra la ejecución aburrida por debajo. Si aciertas con esa frontera, los agentes gestionados son puro apalancamiento. Si la fallas, una cómoda llamada a la API se convierte en la razón por la que nunca podrás irte.

Comentarios

Aún no hay comentarios

Inicia sesión para unirte a la conversación.

Sé el primero en compartir una idea.