BUSINESS · 2026年6月10日

「托管 agent」很方便，直到你想走却走不了

谷歌、Anthropic 和其他厂商正在推销 AI 领域最容易上钩的卖点：一次 API 调用，我们就帮你把整个 agent 跑起来——sandbox、工具、记忆、状态，全都在我们的基础设施上。这确实很方便，做个原型时尤其香。但要看清你刚刚交出去的是什么。托管的模型 API 租给你的是大脑，大脑随时可以换掉。托管的 agent 租给你的是产品的整套神经系统，这个钩子要深得多。在这里，便利和锁定其实是同一笔交易——只是账单会晚一点才来。

眼下 AI 领域最火的卖点就是托管 agent。这一季谷歌正式推出了 Gemini API 里的 Managed Agents：一次 API 调用就能在一个隔离的云端 sandbox 里拉起一个 agent，它在里面推理、规划、调用工具、运行代码、管理文件、保存状态—— 这一切都由谷歌的基础设施搞定，你什么都不用自己搭。Anthropic 也推出了自己的 Claude Managed Agents，做成了一个一站式服务。各家的承诺都一样：跳过管道工活儿，一天就把 agent 上线。

它确实很方便，我也不想假装不是这样。对于一个原型、一个用完即弃的东西、一个风险很低的项目来说，托管 agent 是笔好买卖。但你值得看清楚自己到底买的是什么，因为在这件事上，便利和锁定恰恰是同一笔交易——而代价出现的时间，要比便利晚得多。

你租的不再是模型了，你租的是整套神经系统。

这里有个关键的区别。我以前写过，藏在干净接缝后面的模型是可以随时替换的——你租的是大脑，而换大脑只需要改一个配置值。托管 agent 是另一回事。你租的不只是模型，你还租了 runtime（agent 在哪里执行）、 记忆和状态（它在多次运行之间记住了什么）、工具层（它怎么动手做事）以及 可观测性（你怎么看到它做了什么）。这不是一个组件。这是你产品的整个操作系统，跑在某一家厂商的高墙之内。

而且和模型不一样，这些部分会 越积越多。正如对这一波浪潮的分析所说，你最终会把自己的 agent 架构嵌进平台的 runtime、治理和可观测性里，这种嵌入会随时间不断叠加，越来越难以拆解。它跑得越久，你产品的记忆和行为就越多地存放在一个你没法轻易带走的地方。这正是几周前提到的上下文锁定问题，只是又往深处推了一层：锁住的不只是你的数据，而是处理这些数据的整台机器。

10% 测试

有个残酷的数据值得你揣在兜里。2026 年的一项评估发现，大约 90% 号称是 AI「agent」的产品其实是厂商掌控的功能套壳—— 它们没有你能掌控的持久化状态，没有模型可移植性，也没有外部可审计性。只有大约 10% 是真正可移植的平台，agent 能真正独立于厂商的基础设施运行。

这就给了你一个干脆的直觉测试，适用于任何托管 agent 产品：你能不能把你 agent 的记忆、工具和定义拿走，放到别处去跑？ 如果能，那它是个真正的平台，便利是白送的。如果不能——如果你 agent 的大脑、记忆、技能和 runtime 全都是厂商的，没法导出——那它就不是平台，而是一个带退出费的功能，而这笔退出费就是你的整个产品。

用它换速度，把会越积越多的东西解耦出来

这不是一篇「永远别用托管 agent」的文章——那太蠢了，速度的好处是实打实的。这是一篇「搞清楚你在做哪笔交易」的文章。那些最敏锐的团队用的套路，是把会越积越多的部分从厂商的 runtime 里解耦出来：把记忆层、工具/技能库以及编排都保存在你掌控的格式里，这样你换 runtime 时不会丢掉产品积累下来的状态。几条实操建议：

托管对低风险场景和原型来说没问题；任何核心的东西都要解耦。 你越是会因为走不了而受伤，就越不该把你的神经系统放进厂商的 runtime 里。
拥有你的记忆和你的工具。 你 agent 积累下来的状态、它的工具/技能定义，是带引力的那部分。让它们可导出、用开放格式——工具层尽量靠 MCP 这样的开放标准——这样它们就不会被困在某一个 runtime 里。
对 agent runtime 用上你对模型用的那套退出测试。 我一直会这样问一个供应商：如果他们明天把价格翻倍或者关停服务，我要多久才能搬走？对 agent runtime 也这么问。如果诚实的答案是「我们搬不走」，那你买的就不是便利——你买的是一种依赖。
盯住数据，别只盯 runtime。 日志、追踪记录、任何微调结果都存放在某个地方；如果它们只存在于托管服务内部、没法导出，那就是披着仪表盘外衣的锁定。

归根结底

托管 agent 是 AI 里最诱人的报价，因为它用一次调用就帮你去掉了最烦人的活儿—— runtime、管道、状态管理。而这恰恰是它值得你再看一眼的原因。它帮你去掉的那些管道，也正是那些一旦灌满了你产品的记忆和行为，就再也拿不回来、只能从头重建的部分。

所以，在风险低的地方尽管享受便利；在风险不低的地方，记住你交出去的是什么：不是一个你能随手替换的模型，而是你产品用来思考的整台机器。把会越积越多的部分——记忆、工具、编排——构建成你自己的、可移植的，让厂商去跑底下那些无聊的执行环节。这条边界划对了，托管 agent 就是纯粹的杠杆。划错了，一次方便的 API 调用，就会变成你永远走不了的原因。

暂无评论

登录以参与讨论。

做第一个分享想法的人。