2026年6月15日
小众模型击败巨头
Salesforce 刚刚花 36亿美元 买下的那个智能体,跑的并不是花钱能买到的最大、最聪明的模型。它跑在 Apex 上——一个为单一任务(客户支持)打造的更小的模型,Salesforce 说它在真正解决工单这件事上胜过顶级的前沿模型。这个细节比那个价签更值钱。对于一个狭窄、定义明确的任务,专门为它训练的模型可以击败一个什么都懂、什么都不精的通用巨头。下面讲讲为什么伸手去抓最大的模型,通常是错误的本能。
当 Salesforce 宣布 以 36亿美元 收购支持智能体公司 Fin 时, 大多数报道都盯着那个数字。更有意思的细节,是这个智能体跑在什么上面。 不是 GPT,不是 Claude,不是 Gemini——而是 Apex,Fin 自己的模型, 专为客户支持打造,Salesforce 说它在解决工单上胜过顶级的前沿模型。 它端到端地解决了 76% 的支持量。
好好琢磨一下。一个你从没听说过的模型,比那些家喻户晓的巨头更小,却在它被打造出来的那一件事上胜过了它们。这不是侥幸——专业化就是这么运作的,它也是一个反对几乎人人都有的那个本能的论据:开始一个 AI 项目时,伸手去抓最大、最聪明的模型,并默认它会赢。对于一个狭窄的任务,通常它不会赢。我来解释。
最大,是对一个具体问题的通用回答
前沿模型之所以了不起,是因为它们把 所有事 都做得过得去——写代码、规划行程、解释税法、起草邮件。正是这种宽度,恰恰是它们没有针对其中任何一件事做优化的原因。一个庞大的通用模型是个出色的通才:知识广博,却没有一项专长。
大多数真实的产品并不需要通才。它们需要把一件事做到极致。解决支持工单不是「无所不知」——而是「了解这家公司的产品、遵循它的政策、正确处理这几百种反复出现的情况,并知道什么时候该交给人来处理」。一个恰好在这件事上、在多年真实工单上训练出来的模型,会胜过一个把注意力分散到整个人类问题宇宙里的更大模型。在任务上的深度,胜过覆盖所有任务的宽度。
专业化通常还意味着更小、更便宜、更快
让这件事不止是个奇闻的部分在于:专业化模型不只是在它那项任务的质量上获胜——通常在成本和速度上也获胜。一个专为支持打造的模型可以更小,因为它不必背着懂其他一切东西的重量。更小就意味着运行更便宜、响应更快。所以你并不是拿质量去换经济。在那项狭窄的任务上,专家可以同时比巨头更好 且 更便宜 且 更快。
这把惯常的心智模型翻了个个儿。我们往往假设有一架梯子——底部是又小又便宜,顶部是又大又最好——你挑选自己负担得起爬多高。对于一个定义明确的任务,这架梯子是错的图景。问题不是「我能负担起多大的模型」,而是「有没有一个恰好为这件事打造的模型」,因为如果有,它很可能在你在意的每一个维度上都胜过巨头。
该拿这个怎么办
下次你开始做一个 AI 功能时,抵住那个默认抓最大模型的本能。先问一个不一样的问题:
- 我的任务狭窄而定义明确吗? 如果它是一件有清晰规则的事——支持、文档抽取、分类、某种特定的起草——那它就是专家的候选,而不是通才的。
- 是否已经存在一个专为它打造的模型? 一个为你的领域微调过的模型,可能开箱即用就胜过前沿模型,而且更省钱。
- 我能自己把一个更小的模型专业化吗? 在你真实的任务上对一个小模型做微调或紧凑地提示,往往胜过租一个巨头来泛泛地做同一件事。
当任务真的是开放式的时候,再去抓巨头。对于一切狭窄的任务,先找专家。
归根结底
Salesforce 花了 36亿美元 买一个智能体,而它内部的引擎并不是世界上最大的模型——而是一个为这件事打造的更小的模型。这就是全部的教训,明明白白地摆在标题里面。
对于一个狭窄、定义明确的任务,专为它打造的模型通常会击败通用巨头——在质量、成本和速度上同时获胜。 最大的模型作为默认选项的正确次数,远比人们以为的要少。把模型匹配到任务上,而任务通常比巨头要窄。
评论
暂无评论
登录以参与讨论。
做第一个分享想法的人。