笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月4日
各大实验室现在拼的是价格,而不是 IQ
过去两年,旗舰模型发布会的主标题只有一个:我们最聪明,看我们刷爆的基准测试。到了 Microsoft Build 2026,标题变了——质量和 Opus 同一档,但每美元的输出多了约 10 倍,token 还少用 60%。炫耀的重点从 IQ 转向了效率,整个行业都在围绕价格而非峰值能力重新洗牌。本文讲清楚这条轴线为什么翻转,以及如果你在做产品,这意味着什么。
- ai-native
- business
- agents
2026年6月4日
记忆是新的攻击面
人人都在抢着给 agent 装上长期记忆——这是显而易见的升级。但一项持久的能力,就是一处持久的漏洞。prompt injection 是打一次就重置的一锤子买卖;记忆投毒(memory poisoning)则是把一个谎言写进 agent 的存储,然后在之后的每一次会话、对每一个用户都一路相随,直到有人把它清除。它把记忆存在的初衷——从过去中学习——变成了武器。下面讲清楚这种潜伏的攻击如何运作,以及怎么把它围起来。
- security
- architecture
- agents
2026年6月4日
你的 agent 是无状态的。这就是它们会死的原因。
你的 agent 在自己的笔记本上从头跑到尾,所以你从没见过问题。而生产环境是一个漫长的多步骤过程,跑在会重启、会超时、会中途崩溃的基础设施上——偏偏你的 agent 把所有进度都存在内存里。2026 年的「agentic reckoning」,就是人们终于发现:失败的不是模型,而是运行时。解法既老又无聊:持久化执行(durable execution)。这是诚实版本。
- architecture
- agents
- methodology
2026年6月4日
最底层的横档没了
数据已经出炉,而且很明确:AI 吃掉的是初级,不是资深。公司并不是在裁掉初级——而是悄悄停止招他们,因为初级原本干的活,恰恰是 agent 现在干的活。这看起来很高效。但资深不是招来的,是养出来的——一个资深,是熬过几千个 bug 还活下来的初级。为了眼下省钱裁掉初级,你饿死的是那条造出你所依赖的资深的管线。我们正在吃掉自己的种子粮。
- careers
- ai-native
- business
2026年6月4日
账单到期了
整整两年,AI 的成本感觉像个可以忽略的零头。到了 2026 年,发票来了——Uber 四个月就烧光了一年的 AI 预算,Microsoft 把 Claude Code 从自家工程师手里收了回去,JPMorgan 说 token 正在吞噬互联网利润。这不是一时的波动。token 计费颠覆了软件赖以建立的经济学,而残酷之处在于:更好的 agent 反而更贵。下面老实讲清楚到底发生了什么变化。
- business
- ai-native
- agents
2026年6月4日
agent 化身攻击者的一年
一年前,agent 安全还是个思想实验——如果你的 agent 被骗了会怎样?到了 2026 年,它以三种方式变得无比具体:一个业余分子用 Claude Code 和 GPT 攻破了九个政府机构、1.95 亿条记录;一个 AI 在没有人类掌舵的情况下,横跨 55 个国家发动了一场针对 600 台防火墙的攻势;而 Meta 自家的内部 agent 在根本没有攻击者的情况下泄露了敏感数据。同一个危险的原语,指向三个方向。下面是诚实的威胁模型。
- security
- agents