BUSINESS · 2026年6月19日
如何上线一个在车流中驾驶的智能体
Uber、WeRide 和 AVOMO 刚刚宣布在马德里推出西班牙首个商业自动驾驶出租车服务。有意思的不是车,而是上线方式:先上训练有素的安全操作员,只有在达成各项指标后才逐步增加数百辆自动驾驶出租车,等数字够格了才撤掉人。这就是每个认真的智能体都该遵循的部署曲线,软件智能体也不例外。
自动驾驶出租车是最字面意义上的「现实世界中的 AI 智能体」:一个自主系统,在车流里、在人群中,采取 带有真实后果的真实行动。所以值得看看认真的玩家到底是怎么把它上线的——因为这套打法对那些永远不碰 方向盘的智能体同样是一课。
6 月 2 日,Uber、WeRide 和 AVOMO 宣布推出 西班牙首个商业自动驾驶出租车服务, 落地马德里——这是他们联手进军欧洲的第一步,乘客通过 Uber 应用叫车。而他们上线的方式,正是全部 重点所在。
上线方式本身就是这一课
他们不是按下开关就走人。根据 公告,该服务以车上配备训练有素的车辆 操作员起步,合作方承诺随着关键绩效指标的达成逐步增加数百辆自动驾驶出租车——只有当数字越过 门槛时,才扩展到完全无人驾驶。先有监督。自主权是分阶段、靠数字挣来的。
这不是胆怯。这是部署一样东西的正确方式:它真正有能力,但一旦出错也真正后果严重。你把人留在闭环 里,不停地度量,只在证据表明你挣得起的地方撤掉人。
这条曲线不只属于汽车
去掉轮子,这就是任何认真智能体的部署曲线:
- 从有监督开始。 在智能体无人监督地行动之前,先让人盯着它的行动。驾驶座上的安全操作员,就是 智能体 PR(pull request)上的代码审查者,就是批准付款的人,就是在输出发出去之前读一遍它的人。
- 定义里程碑。 提前用数字定好「好到可以松绑」意味着什么——错误率、干预率、成本,任何与你的 风险相匹配的指标。
- 挣来自主权。 只有当某一步骤上度量到的表现越过门槛时,才把人从那一步撤掉。不是因为演示感觉 不错。而是数据这么说。
关于软件智能体,我从另一个方向讲过同样的论点:你不能凭感觉就把一个智能体从受监督升级为自主;你 得盯着它、度量它,随着它赢得信任而扩大它的权限。自动驾驶出租车只是把风险摆得足够显眼,让谁都 不敢动跳过步骤的念头。
物理世界让你保持诚实
汽车上这套纪律之所以如此显而易见,是因为故障很响亮:撞车不是一次无声的回退。软件智能体的故障更 安静:一次糟糕的合并、一笔错误的付款、一条泄露的记录。诱惑在于直接跳到完全自主,因为没什么东西 当场炸开。别这么干。会动钱或会发布代码的智能体,配得上和汇入马德里车流的那个一样的「先有监督、 再挣自主」的上线方式——只不过后果没那么上镜罢了。
底线
自动驾驶出租车的发布不是关于汽车的故事。它是部署任何自主而后果严重之物的一份干净模板。
从有监督开始,用数字定义里程碑,只有当度量到的表现挣得起时才撤掉人。 这就是把一个智能体放进 车流的方式——也是你该把它放进生产环境的方式,哪怕唯一能撞毁的只有你的代码库。
评论
暂无评论
登录以参与讨论。
做第一个分享想法的人。