ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月4日
各大实验室现在拼的是价格，而不是 IQ
过去两年，旗舰模型发布会的主标题只有一个：我们最聪明，看我们刷爆的基准测试。到了 Microsoft Build 2026，标题变了——质量和 Opus 同一档，但每美元的输出多了约 10 倍，token 还少用 60%。炫耀的重点从 IQ 转向了效率，整个行业都在围绕价格而非峰值能力重新洗牌。本文讲清楚这条轴线为什么翻转，以及如果你在做产品，这意味着什么。
- ai-native
- business
- agents
2026年6月4日
记忆是新的攻击面
人人都在抢着给 agent 装上长期记忆——这是显而易见的升级。但一项持久的能力，就是一处持久的漏洞。prompt injection 是打一次就重置的一锤子买卖；记忆投毒（memory poisoning）则是把一个谎言写进 agent 的存储，然后在之后的每一次会话、对每一个用户都一路相随，直到有人把它清除。它把记忆存在的初衷——从过去中学习——变成了武器。下面讲清楚这种潜伏的攻击如何运作，以及怎么把它围起来。
- security
- architecture
- agents
2026年6月4日
你的 agent 是无状态的。这就是它们会死的原因。
你的 agent 在自己的笔记本上从头跑到尾，所以你从没见过问题。而生产环境是一个漫长的多步骤过程，跑在会重启、会超时、会中途崩溃的基础设施上——偏偏你的 agent 把所有进度都存在内存里。2026 年的「agentic reckoning」，就是人们终于发现：失败的不是模型，而是运行时。解法既老又无聊：持久化执行（durable execution）。这是诚实版本。
- architecture
- agents
- methodology
2026年6月4日
最底层的横档没了
数据已经出炉，而且很明确：AI 吃掉的是初级，不是资深。公司并不是在裁掉初级——而是悄悄停止招他们，因为初级原本干的活，恰恰是 agent 现在干的活。这看起来很高效。但资深不是招来的，是养出来的——一个资深，是熬过几千个 bug 还活下来的初级。为了眼下省钱裁掉初级，你饿死的是那条造出你所依赖的资深的管线。我们正在吃掉自己的种子粮。
- careers
- ai-native
- business
2026年6月4日
账单到期了
整整两年，AI 的成本感觉像个可以忽略的零头。到了 2026 年，发票来了——Uber 四个月就烧光了一年的 AI 预算，Microsoft 把 Claude Code 从自家工程师手里收了回去，JPMorgan 说 token 正在吞噬互联网利润。这不是一时的波动。token 计费颠覆了软件赖以建立的经济学，而残酷之处在于：更好的 agent 反而更贵。下面老实讲清楚到底发生了什么变化。
- business
- ai-native
- agents
2026年6月4日
agent 化身攻击者的一年
一年前，agent 安全还是个思想实验——如果你的 agent 被骗了会怎样？到了 2026 年，它以三种方式变得无比具体：一个业余分子用 Claude Code 和 GPT 攻破了九个政府机构、1.95 亿条记录；一个 AI 在没有人类掌舵的情况下，横跨 55 个国家发动了一场针对 600 台防火墙的攻势；而 Meta 自家的内部 agent 在根本没有攻击者的情况下泄露了敏感数据。同一个危险的原语，指向三个方向。下面是诚实的威胁模型。
- security
- agents