笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月19日
你的模型只有六周保质期
本月在短短两周的窗口里,行业就发布了 Claude Mythos 5、GPT-5.6、Gemini 3.2,以及一整面墙的中国前沿模型——Qwen 3.7、DeepSeek V4.1、GLM-6 等等。新的前沿模型如今大约每六周就按节拍器般落地。如果你产品的优势是「我们用最好的模型」,那这个优势比一个季度还快过期。这篇讲讲如何为移动的靶子去搭建。
- ai-native
- architecture
2026年6月15日
一天烧掉 1500 万美元的应用
OpenAI 打造了史上炒作最猛的 AI 视频应用,半年后却悄悄把它关停。据报道,Sora 每天在算力上烧掉约 1500 万美元,而总收入只有约 210 万美元——不是每天,是总共。人们爱它,可它在每一个片段上都在亏钱。这是传统软件从没教过我们的一课:生成式功能每被人用一次都有真实成本,而「火爆」治不好「每次使用都亏钱」。这里教你在自己的 AI 功能重蹈覆辙之前先做一次检查。
- business
- ai-native
2026年6月15日
小众模型击败巨头
Salesforce 刚刚花 36亿美元 买下的那个智能体,跑的并不是花钱能买到的最大、最聪明的模型。它跑在 Apex 上——一个为单一任务(客户支持)打造的更小的模型,Salesforce 说它在真正解决工单这件事上胜过顶级的前沿模型。这个细节比那个价签更值钱。对于一个狭窄、定义明确的任务,专门为它训练的模型可以击败一个什么都懂、什么都不精的通用巨头。下面讲讲为什么伸手去抓最大的模型,通常是错误的本能。
- ai-native
- business
2026年6月14日
AI 智能体刚刚拿到了你的信用卡
2026 年 6 月 10 日,Visa 把自己的支付网络直接接进了 ChatGPT。现在,AI 智能体可以替你在任何接受 Visa 的商家购物并付款——挑选商品、走完结账、把账结清——用的是一份专门授权给该智能体的凭证,带着你事先设好的额度上限和商家限制。麦肯锡认为,到 2030 年,智能体驱动的购物可能占到一万亿美元的美国零售额。过去两年,智能体只能推荐;现在,它们能花钱了。当软件握住那张卡时,到底有什么变了,以及在你把卡交出去之前该问的那一个问题,本文一一道来。
- business
- ai-native
2026年6月14日
那个快模型,突然变聪明了
两年来,每次选模型你都得做个取舍:要么又快又便宜,要么又聪明又慢。Gemini 3.5 Flash 刚刚打破了这个规则。这个『Flash』档——本该是便宜又快的那一档——如今在 Artificial Analysis Intelligence Index 上拿下 55 分,领先 Grok 4.3 和 Claude Sonnet 4.6,同时跑出每秒超过 280 个 token 的速度。快模型不再是笨模型。这应该让你重新打开一个大多数团队一年前悄悄冻结的决定:你的默认模型是哪个,它现在还是对的吗?这篇讲讲该怎么想——也包括那个坑。
- ai-native
- business
2026年6月13日
智能体正在变成一种功能,而不是一款产品
Gartner 预计,到 2026 年底,40% 的企业级应用会内嵌面向特定任务的 AI 智能体,而一年前这个比例还不到 5%。智能体式 AI 是增长最快的企业级优先事项,同比上升 31.5%。把这些数字放在一起看,会得出一个让很多创业公司不舒服的结论:智能体正在变成人们已经在用的软件里的一个功能,而不是一款值得他们专门切换过去的独立产品。如果你的全部卖点就是「我们做了一个能干 X 的智能体」,那么掌握 X 的那款应用很快也会把它做出来。这篇文章讲讲这意味着什么、以及你该做什么。
- business
- ai-native