笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月5日
AI 开始在后台给你画像了
直到本周,ChatGPT 都只记得你明确让它记住的东西。从 6 月 4 日起,它会“做梦”——一个后台进程读遍你过去所有的对话,悄悄为你建立一套模型,并自行让它保持更新。这是一次真正有用的升级,也是聊天机器人变成画像工具的那一刻。欧盟的数据监管机构今天正是这么说的。本文用大白话讲清楚到底变了什么——以及为什么这是锚定(grounding)问题,只不过这次对准的是你。
- ai-native
- security
2026年6月5日
四周内四款旗舰模型——“哪个模型赢”是一种设计坏味道
这个月一波旗舰模型几乎同时发布——Gemini 3.5 Pro、新版 Claude、Grok 5,而 Opus 4.8 已经上线。所有人都在刷新排行榜。如果这波发布让你焦虑——我们用的是不是最好的那个,要不要换——这份焦虑透露的是你架构的问题,而不是模型的问题。这里是我诚实的看法,以及“保持可替换”到底需要什么。
- ai-native
- architecture
2026年6月4日
token 付费墙不是 SaaS
创业者们正用 SaaS 的本能给 AI 产品定价——固定月费、按席位——然后悄悄地流血,因为让 SaaS 变得神奇的那个东西已经没了。趋近于零的边际成本死了:每个用户都在烧 token,永远地烧,成本随使用量上升。GitHub Copilot 在统一 $10 定价下,每个重度用户每月最多亏 $80。AI 产品不是高毛利率的软件;它更接近一个有着实打实销货成本的公用事业。就该这么定价。
- business
- ai-native
2026年6月4日
各大实验室现在拼的是价格,而不是 IQ
过去两年,旗舰模型发布会的主标题只有一个:我们最聪明,看我们刷爆的基准测试。到了 Microsoft Build 2026,标题变了——质量和 Opus 同一档,但每美元的输出多了约 10 倍,token 还少用 60%。炫耀的重点从 IQ 转向了效率,整个行业都在围绕价格而非峰值能力重新洗牌。本文讲清楚这条轴线为什么翻转,以及如果你在做产品,这意味着什么。
- ai-native
- business
- agents
2026年6月4日
最底层的横档没了
数据已经出炉,而且很明确:AI 吃掉的是初级,不是资深。公司并不是在裁掉初级——而是悄悄停止招他们,因为初级原本干的活,恰恰是 agent 现在干的活。这看起来很高效。但资深不是招来的,是养出来的——一个资深,是熬过几千个 bug 还活下来的初级。为了眼下省钱裁掉初级,你饿死的是那条造出你所依赖的资深的管线。我们正在吃掉自己的种子粮。
- careers
- ai-native
- business
2026年6月4日
账单到期了
整整两年,AI 的成本感觉像个可以忽略的零头。到了 2026 年,发票来了——Uber 四个月就烧光了一年的 AI 预算,Microsoft 把 Claude Code 从自家工程师手里收了回去,JPMorgan 说 token 正在吞噬互联网利润。这不是一时的波动。token 计费颠覆了软件赖以建立的经济学,而残酷之处在于:更好的 agent 反而更贵。下面老实讲清楚到底发生了什么变化。
- business
- ai-native
- agents