AI-NATIVE · 2026年6月15日

小众模型击败巨头

Salesforce 刚刚花 36亿美元买下的那个智能体，跑的并不是花钱能买到的最大、最聪明的模型。它跑在 Apex 上——一个为单一任务（客户支持）打造的更小的模型，Salesforce 说它在真正解决工单这件事上胜过顶级的前沿模型。这个细节比那个价签更值钱。对于一个狭窄、定义明确的任务，专门为它训练的模型可以击败一个什么都懂、什么都不精的通用巨头。下面讲讲为什么伸手去抓最大的模型，通常是错误的本能。

当 Salesforce 宣布以 36亿美元收购支持智能体公司 Fin 时，大多数报道都盯着那个数字。更有意思的细节，是这个智能体跑在什么上面。不是 GPT，不是 Claude，不是 Gemini——而是 Apex，Fin 自己的模型，专为客户支持打造，Salesforce 说它在解决工单上胜过顶级的前沿模型。它端到端地解决了 76% 的支持量。

好好琢磨一下。一个你从没听说过的模型，比那些家喻户晓的巨头更小，却在它被打造出来的那一件事上胜过了它们。这不是侥幸——专业化就是这么运作的，它也是一个反对几乎人人都有的那个本能的论据：开始一个 AI 项目时，伸手去抓最大、最聪明的模型，并默认它会赢。对于一个狭窄的任务，通常它不会赢。我来解释。

最大，是对一个具体问题的通用回答

前沿模型之所以了不起，是因为它们把 所有事 都做得过得去——写代码、规划行程、解释税法、起草邮件。正是这种宽度，恰恰是它们没有针对其中任何一件事做优化的原因。一个庞大的通用模型是个出色的通才：知识广博，却没有一项专长。

大多数真实的产品并不需要通才。它们需要把一件事做到极致。解决支持工单不是「无所不知」——而是「了解这家公司的产品、遵循它的政策、正确处理这几百种反复出现的情况，并知道什么时候该交给人来处理」。一个恰好在这件事上、在多年真实工单上训练出来的模型，会胜过一个把注意力分散到整个人类问题宇宙里的更大模型。在任务上的深度，胜过覆盖所有任务的宽度。

专业化通常还意味着更小、更便宜、更快

让这件事不止是个奇闻的部分在于：专业化模型不只是在它那项任务的质量上获胜——通常在成本和速度上也获胜。一个专为支持打造的模型可以更小，因为它不必背着懂其他一切东西的重量。更小就意味着运行更便宜、响应更快。所以你并不是拿质量去换经济。在那项狭窄的任务上，专家可以同时比巨头更好且更便宜且更快。

这把惯常的心智模型翻了个个儿。我们往往假设有一架梯子——底部是又小又便宜，顶部是又大又最好——你挑选自己负担得起爬多高。对于一个定义明确的任务，这架梯子是错的图景。问题不是「我能负担起多大的模型」，而是「有没有一个恰好为这件事打造的模型」，因为如果有，它很可能在你在意的每一个维度上都胜过巨头。

该拿这个怎么办

下次你开始做一个 AI 功能时，抵住那个默认抓最大模型的本能。先问一个不一样的问题：

我的任务狭窄而定义明确吗？ 如果它是一件有清晰规则的事——支持、文档抽取、分类、某种特定的起草——那它就是专家的候选，而不是通才的。
是否已经存在一个专为它打造的模型？ 一个为你的领域微调过的模型，可能开箱即用就胜过前沿模型，而且更省钱。
我能自己把一个更小的模型专业化吗？ 在你真实的任务上对一个小模型做微调或紧凑地提示，往往胜过租一个巨头来泛泛地做同一件事。

当任务真的是开放式的时候，再去抓巨头。对于一切狭窄的任务，先找专家。

归根结底

Salesforce 花了 36亿美元买一个智能体，而它内部的引擎并不是世界上最大的模型——而是一个为这件事打造的更小的模型。这就是全部的教训，明明白白地摆在标题里面。

对于一个狭窄、定义明确的任务，专为它打造的模型通常会击败通用巨头——在质量、成本和速度上同时获胜。 最大的模型作为默认选项的正确次数，远比人们以为的要少。把模型匹配到任务上，而任务通常比巨头要窄。

暂无评论

登录以参与讨论。

做第一个分享想法的人。