ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月5日
AI 开始在后台给你画像了
直到本周，ChatGPT 都只记得你明确让它记住的东西。从 6 月 4 日起，它会“做梦”——一个后台进程读遍你过去所有的对话，悄悄为你建立一套模型，并自行让它保持更新。这是一次真正有用的升级，也是聊天机器人变成画像工具的那一刻。欧盟的数据监管机构今天正是这么说的。本文用大白话讲清楚到底变了什么——以及为什么这是锚定（grounding）问题，只不过这次对准的是你。
- ai-native
- security
2026年6月5日
四周内四款旗舰模型——“哪个模型赢”是一种设计坏味道
这个月一波旗舰模型几乎同时发布——Gemini 3.5 Pro、新版 Claude、Grok 5，而 Opus 4.8 已经上线。所有人都在刷新排行榜。如果这波发布让你焦虑——我们用的是不是最好的那个，要不要换——这份焦虑透露的是你架构的问题，而不是模型的问题。这里是我诚实的看法，以及“保持可替换”到底需要什么。
- ai-native
- architecture
2026年6月4日
token 付费墙不是 SaaS
创业者们正用 SaaS 的本能给 AI 产品定价——固定月费、按席位——然后悄悄地流血，因为让 SaaS 变得神奇的那个东西已经没了。趋近于零的边际成本死了：每个用户都在烧 token，永远地烧，成本随使用量上升。GitHub Copilot 在统一 $10 定价下，每个重度用户每月最多亏 $80。AI 产品不是高毛利率的软件；它更接近一个有着实打实销货成本的公用事业。就该这么定价。
- business
- ai-native
2026年6月4日
各大实验室现在拼的是价格，而不是 IQ
过去两年，旗舰模型发布会的主标题只有一个：我们最聪明，看我们刷爆的基准测试。到了 Microsoft Build 2026，标题变了——质量和 Opus 同一档，但每美元的输出多了约 10 倍，token 还少用 60%。炫耀的重点从 IQ 转向了效率，整个行业都在围绕价格而非峰值能力重新洗牌。本文讲清楚这条轴线为什么翻转，以及如果你在做产品，这意味着什么。
- ai-native
- business
- agents
2026年6月4日
最底层的横档没了
数据已经出炉，而且很明确：AI 吃掉的是初级，不是资深。公司并不是在裁掉初级——而是悄悄停止招他们，因为初级原本干的活，恰恰是 agent 现在干的活。这看起来很高效。但资深不是招来的，是养出来的——一个资深，是熬过几千个 bug 还活下来的初级。为了眼下省钱裁掉初级，你饿死的是那条造出你所依赖的资深的管线。我们正在吃掉自己的种子粮。
- careers
- ai-native
- business
2026年6月4日
账单到期了
整整两年，AI 的成本感觉像个可以忽略的零头。到了 2026 年，发票来了——Uber 四个月就烧光了一年的 AI 预算，Microsoft 把 Claude Code 从自家工程师手里收了回去，JPMorgan 说 token 正在吞噬互联网利润。这不是一时的波动。token 计费颠覆了软件赖以建立的经济学，而残酷之处在于：更好的 agent 反而更贵。下面老实讲清楚到底发生了什么变化。
- business
- ai-native
- agents