笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月7日
对长时间运行的智能体来说,每个任务的成本才是唯一的基准
英伟达新推出的 Nemotron 3 Ultra 卖点不是「最聪明的模型」,而是「连续跑好几个小时也便宜」——专为那些要做规划、调用工具、跨上百轮推理的智能体打造。这个定位才是真正值得关注的事。当一个智能体长时间运行,真正重要的数字就不再是基准跑分或每个 token 的单价,而是「完成一个任务要花多少钱」。两个 token 单价相同的模型,在真实任务上的开销可能差出两倍。下面说说,为什么一旦你的智能体运行时间超过一瞬间,排行榜就成了错误的选购依据。
- ai-native
- business
- eval
2026年6月7日
你摆脱了模型锁定。他们把锁定挪到了你的上下文里。
让模型可以随时替换,是今年最大的胜利——现在改一行配置就能换供应商。于是在 Build 2026 上,微软不慌不忙地把锁定挪到了你换不掉的地方:你公司的上下文。Work IQ、Fabric IQ、Foundry IQ——你公司的记忆、权限和含义,全都活在供应商对你业务的理解之中。正如一位分析师所说:你可以换大脑,但你未必能换记忆。这就是新的陷阱,以及如何让真正重要的那部分保持可迁移。
- architecture
- business
- ai-native
2026年6月7日
当你的客户是个机器人
谷歌的智能体现在能代你预订和下单,Visa 和万事达为智能体付款铺好了轨道,一波『智能体商务』协议随 Shopify、沃尔玛和 Target 一起上线。背后那个安静的含义是:评估你产品的,越来越是软件,而不是人。AI 智能体不『逛』——它们 87% 的请求打向产品数据,几乎没有一个碰你精心设计的店面。网页是为人的眼球而生的,而买家刚刚换了物种。这对任何在线销售、构建或交付东西的人意味着什么,本文来讲清楚。
- business
- ai-native
2026年6月6日
Supabase 估值 105 亿美元,因为智能体需要无聊的数据库
Supabase 刚以 105 亿美元估值融资 5 亿美元——八个月翻了一倍——原因近乎好笑:平台上超过 60% 的新数据库如今由 AI 工具创建,而非人类。AI 热潮里最炫的部分是写代码的智能体;而那个悄悄印钞的部分,是这些代码必须把数据放进去的、无聊又可靠的地方。这不是巧合,而是关于持久价值藏在哪里的全部教训。
- business
- architecture
- ai-native
2026年6月6日
微软能炒掉它的模型供应商。你能吗?
在 Build 2026 大会上,微软推出了自家的编程模型和推理模型——从零开始训练,用其 AI 负责人的话说,对 OpenAI 做到了「零蒸馏」——并直接接入了 GitHub Copilot。地球上最有钱的软件公司刚刚花掉数十亿美元,只为不再依赖单一供应商。这就是给我们其余人的全部教训,而且它一分钱不花:永远别让模型成为你系统里换不掉的那部分。
- architecture
- ai-native
- business
2026年6月6日
氛围编程的时代结束了。难的从来不是做出demo。
谷歌如今在一门免费的五天课程里,向一百多万人传授氛围编程。当你引以为傲的东西变成一堂周末课,这项技能就不再是你的优势了。但标题没说的那部分才是关键:氛围编程一直擅长那容易的80%——也就是demo——却对决定软件能否存活的那20%束手无策。如今真正稀缺的技能不是生成代码,而是判断你拿到的代码到底好不好的眼力。
- careers
- methodology
- ai-native