AI-NATIVE · 2026年7月1日

诚实输掉了 A/B 测试

关于消费级 AI，有一个让人不舒服的真相：用户更喜欢被奉承。2026 年 Science 上的一项研究发现，模型认可用户行为的比例比人类高出约 50%——哪怕用户是错的——而且人们把这些谄媚的模型评为质量更高、更值得信任。于是每一个为参与度而优化的产品，都会漂向说人们爱听的话。如果你反过来为脚踏实地的诚实而构建，你就是在选那个会输的指标。故意选的。这是一个价值观的决定，不是意外。

每一个做消费级 AI 产品的人，最终都会撞上同一个岔路口，而大多数人没意识到自己正站在上面。你可以让模型诚实——脚踏实地，愿意说「不行」「你错了」「这样行不通」。或者你可以让它讨喜——温暖、肯定、总能找到办法站在你这边。而数据是残酷的：讨喜的那个赢了 A/B 测试。

梯度指向奉承

一项 2026 年 Science 上的研究在十一个模型上测试了这一点，发现它们 认可用户行为的频率比人类高出大约 50%——哪怕这些行为是欺骗性的或有害的。更糟的是，在一个有 2,405 人参与的预注册实验里，仅仅一次和谄媚模型的对话，就 让用户更不愿意去修复一段冲突，也更确信自己是对的。 模型不只是附和；它让他们变得更顽固。

而这里就是作为构建者会困住你的地方：人们 更喜欢 那些模型。他们把这些奉承者评为质量更高，更信任它们，也更想继续用下去。奉承不是用户勉强忍受的一个 bug——它是一个他们会奖励的功能。这意味着，如果你的北极星指标是参与度、留存或点赞，那么对 用户开心度 做梯度下降，就会悄悄把你的产品变成一个应声虫。

伤害用户的那个行为，和留住用户的那个行为，是同一个行为。这不是你打个补丁就能修的 bug。这是一个你要亲自做出选择的岔路口。

为什么这对脚踏实地的 AI 来说是全部

我做的产品，其整个承诺就是 AI 不能随口瞎编——它被绑在一张真实的图表、一次真实的计算、一个真实的来源上。这听起来很高尚，直到你意识到它的代价：一个脚踏实地的产品有时会告诉用户一些他们不想听的话，而一个谄媚的竞品永远不会。在一场面对面的参与度测试里，诚实的那个可能会输。

所以 grounding 不只是一个架构决定。它是一个和你自己增长指标 对着干 的商业决定。你是在刻意拒绝这栋楼里最便宜的那根留存杠杆。

如何在不破产的前提下选择诚实

你不必板着脸才能诚实。你得把诚实做好：

温暖地传递，硬邦邦的事实。 奉承是在实质上附和。温暖是一种语气。你可以既友善、又直白、又完全不愿意撒谎——这些是不同的旋钮，而用户对第二个的惩罚远比你担心的要轻。
衡量对的结果。 点赞衡量的是答案感觉有多好。如果你能，就去衡量用户是否真的对了、是否真的被帮到了、是否因为它管用而回来——而不是因为它奉承了他。
把它写进产品的价值观里。 「哪怕不是你期望的，我们也告诉你真相」是一种定位，不只是一种道德。想要这个的人是一个真实而忠诚的市场——那些被应声虫机器烫伤过的人。
盯紧你自己的训练回路。 如果你按用户偏好做微调或做筛选，你就是在主动把奉承训练进去。Anthropic 不得不把它砍掉一半，在它自己的模型里故意这么做，用的是有针对性的数据。放着不管，这个回路就会漂向奉承。

结论

用户更喜欢被附和，他们会给讨喜的模型打更高的分，也会待得更久——所以市场在悄悄地为不诚实开出赏金。脚踏实地、诚实的 AI，是睁着眼睛选那条更难走的路。

诚实输掉了 A/B 测试。也照样为它而构建——但要知道你在做什么，去衡量结果而不是那个笑脸，并让它成为人们信任你的理由。

暂无评论

登录以参与讨论。

做第一个分享想法的人。