笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年7月1日
你的 agent 有一堆没人拥有的登录凭证
今年企业冒出了数以百万计的 AI agent,而每一个都需要凭证才能真正做点事——读数据库、发邮件、调 API。管理这些凭证的治理层还不存在。结果:68% 的组织无法可靠地把 agent 的活动和人的活动区分开来,而活生生的凭证正在往生产环境里写,却没有一个能负责的人。agentic 企业真正的安全问题不是 prompt injection,而是身份(identity)。
- security
- agents
2026年7月1日
你那百万 token 的上下文窗口在骗你
厂商把上下文长度当 RAM 来卖:越大越好,把所有东西都塞进去就行。但注意力并不均匀。研究一次又一次发现同样的 U 形——模型会稳定地用到窗口的开头和结尾,却悄悄忽略中间部分,一旦重要的东西被埋在那里,准确率会掉 30%+,有时才 10k token 就开始了。上下文不是一个你往里装东西的桶。它是一种稀缺的、跟位置有关的资源,需要你去设计。「全都放进 prompt 里」就是新的过早优化。
- architecture
- methodology
2026年7月1日
你的模型是个供应商,不是基础设施
创业者把前沿模型当成电力——一种永远在墙里插座上的公用事业。它不是。它是一个供应商,生命周期越来越短,而那个关闭它的开关不在你手里。2026 年,我们眼看着一个顶级模型在发布几天后就被全球下架,原因跟任何在它之上做产品的人都毫无关系。模型可移植性不是过度设计。它是一个跑在自己不拥有的 API 上的生意的最低姿态。
- business
- architecture
2026年6月23日
一份伪造的 bug 报告劫持了编码 agent
安全研究人员展示了一种名为「Agentjacking」的新攻击:往一家公司的 Sentry 里发送一份伪造的错误,它的 AI 编码 agent 就会读取那些「修复步骤」并执行——把你的凭证以你自己的权限交给攻击者。在测试中,Claude Code、Cursor 和 Codex 全都中招。这个教训比单个工具更大:你的 agent 读到的每一样不可信的东西,都是有人可以注入命令的地方。
- security
- agents
2026年6月23日
赢的不是最好的模型,是默认的那个。
ChatGPT 首次跌破 AI 助手市场的 50%,而一年半前还是 65%。Gemini 一路猛涨,最大的原因不是它更聪明,而是 Gemini 是默认选项,内建在 Android 和 Google Workspace 里。对所有做 AI 产品的人来说,这就是那条教训:分发几乎每次都能赢过模型。
- ai-native
- business
2026年6月23日
稀缺资源是那些设计架构的人
Noam Shazeer——「Attention Is All You Need」的合著者之一,这篇论文几乎撑起了当今每一个现代 AI 模型——刚刚离开 Google 加入 OpenAI,距离 Google 花 27 亿美元把他请回来还不到两年。三天之内,Google 失去了两位 AI 重量级人物。抛开这些戏剧性,剩下一个清晰的信号:AI 的瓶颈不是算力,也不是数据。而是那一小撮设计架构的人。
- architecture
- business