ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月5日
“Agent OS”只是个营销词——藏在背后的是一份无聊的清单
这个月人人都发布了“智能体操作系统”——Fiserv、Experian、Microsoft，还有十几家创业公司。“OS”这个词听起来像是认真的基础设施，有时候确实是，但更多时候只是个起了个大名字的套壳产品。好消息是：有一份简短、不起眼的清单能区分这两者——而且它讲的正是我一直在写的那些东西。判断一个Agent OS，要看盒子里装了什么，而不是盒子上贴的标签。
- architecture
- agents
- business
2026年6月5日
智能体正进入“出错就是官司”的领域
本周 Experian 推出了一套面向信贷的 Agent OS（智能体操作系统）——由智能体来决定信贷、识别欺诈、判定谁有资格。在这些场景里，一次幻觉不再是聊天机器人尴尬的回复；它意味着一笔被拒的贷款、一次错误的医疗授权、一张传票。有一个数字点明了风险：AI 医疗拒赔在申诉时有 80% 以上被推翻——但提出申诉的人不到 1%。这就是为什么受监管领域会让关于智能体的整套论证真正变成法律。
- architecture
- business
- agents
2026年6月5日
微软派出 100 个智能体猎捕漏洞——说实话，聊聊 AI 对 AI 的安全
这周微软展示了一支完全由 AI 组成的安全团队：一条由 100 多个智能体组成的流水线，找出了 16 个新的 Windows 漏洞，其中四个是严重漏洞，还诞生了第一个能自动判定 malware 的 AI。防守方现在跑着自主 AI，攻击方也一样——有一个 AI 独立完成了一次真实入侵的 80–90%。今年春天，“AI 对 AI 的安全”不再只是一句口号。这是我诚实的判断：它是实打实的进步，也是一场更快到来的僵局。
- security
- agents
2026年6月5日
每台笔记本里都有一个 agent —— 以及 token 账单的终结
整个春天，所有人都在为 token 账单恐慌。这周 NVIDIA 给出了一个将在今秋落地的结构性答案：agent 搬进你的笔记本。RTX Spark 能在本地运行一个 1200 亿参数、上下文达一百万 token 的模型 —— 没有按 token 计费的电表，你的数据永不离开机器，而且处理那些轻快的活儿更快。它不会取代前沿，但它悄悄地一次性回答了今年最大的三个头疼问题。
- ai-native
- business
2026年6月5日
最好的安全 AI 如今被门禁式限制——按你不在名单上来做规划
今年春天，AI 跨过了一条线：Anthropic 的 Mythos 自己找出了数千个前所未见的零日漏洞，OpenAI 则推出了一款对黑客相关工作更宽松的“网络”模型。同一个能找出上千个漏洞来修补的模型，也能找出它们来加以利用——于是各大实验室把最好的安全模型放到了天鹅绒围栏（VIP 门槛）后面，只对经审核的合作伙伴和政府开放。这说得过去。但它也意味着，现在由一家厂商来决定谁能得到保护。这是写给所有不在名单上的人的实话。
- security
- business
2026年6月5日
一个联邦 AI 标准凌驾于五十个州之上——如果你做开发，这意味着什么
昨天，一份 269 页的两党法案出炉，它可能覆盖每个州的 AI 法律，新闻吵得很响。如果你用 AI 做开发，真正有用的问题不是政治，而是这是否改变了你实际要做的事。坦白说：比标题暗示的要少得多，因为真正约束你产品的规则，本就不是这份法案触及的。下面用大白话讲清楚两层的版本。
- business
- ai-native