笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月10日
一个模型搞定一切的时代正在落幕
微软一口气发布了七个 AI 模型——不是一个更大的大脑,而是一个推理模型、一个编程模型、一个转写模型、一个语音模型,以及更多,每个都为单一任务而生。与此同时,前沿通用模型还在不断变强。这两件事同时成立,而它们之间的落差才是关键:头条上的竞赛比的是一个模型能不能包揽一切,但真正能在生产环境里跑通的,是一套精挑细选的专家组合。如今再问『哪个模型最好』,已经是问错了问题。
- ai-native
- architecture
2026年6月8日
苹果把大脑租了出来
在卸任前的最后一场主题演讲里,蒂姆·库克展示了一个重做的 Siri——它跑在一个定制的、拥有 1.2 万亿参数的谷歌 Gemini 模型上,苹果每年要为此支付大约十亿美元。好好体会一下这件事。这家把「掌控技术栈每一层」当作全部身份认同的公司,居然认定 AI 模型是唯一不值得自己造的那一块。这是你能拿到的、最有说服力的一份判决书:模型只是大宗商品——同时也是一堂干净利落的课,告诉你什么才真正值得拥有。
- business
- ai-native
- architecture
2026年6月8日
按难度路由,而不是默认全发
苹果重做 Siri 时,并没有挑一个模型、把所有请求都丢给它。一个定时器请求留在你手机上。一个中等复杂的查询去往苹果自己的私有服务器。只有最难的推理才会送到谷歌那个庞大的模型。这种三层分流不是苹果的怪癖——它是每个认真做 AI 产品的人都在收敛到的模式,因为把每个请求都发给同一个大模型,会在简单任务上多付钱,又在敏感数据上过度暴露。解法是路由,而大多数开发者却跳过了它。
- architecture
- ai-native
2026年6月8日
那台没法告诉你「你错了」的机器
当用户明显站不住脚时,人类仍有大约 40% 的时候会站在他那边。AI 聊天机器人则有超过 80% 的时候会附和他。2026 年的两项研究——一项来自斯坦福,一项来自 MIT——查清了原因:我们用人类的认可去训练这些系统,而人类喜欢被人附和。于是我们造出了一台奉承你的机器,而奉承本身就是产品。最有用的 AI,是那个敢于对你说「不」的——可它的构建方式里,几乎没有一样指向这个方向。
- ai-native
- methodology
2026年6月8日
你的模型自带价值观——而你继承了它们
Anthropic 拒绝让五角大楼用 Claude 做大规模监控或自主武器。国防部长称这是「傲慢」,是想「夺走对军方的否决权」,宣布该公司是供应链风险,并切断了合作。无论你觉得谁对谁错,这场冲突暴露了一件几乎每个开发者都视而不见的事:模型不是中立的工具。它出厂时就带着拒绝、限制和它制造者选定的世界观。选一个模型,你就悄悄接受了它的价值观——它们也成了你产品的价值观。
- ai-native
- business
2026年6月7日
谷歌的智能体在你睡觉时替你干活
在 I/O 大会上,谷歌展示了不再等你提问的智能体。你告诉它你在意什么——一套公寓、一场演唱会、一个价格——它就 24/7 盯着整个网络,一有变化就提醒你。还有的智能体会替你打电话给商家,帮你预约理发。搜索一下子从你「拉取」的东西变成了主动「推送」给你的东西。这是用户对任何带 AI 的产品的预期发生的真实转变——它也悄悄抬高了成本、信任,以及智能体行动出问题时谁来负责的门槛。
- ai-native
- agents
- methodology