笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月5日
“Agent OS”只是个营销词——藏在背后的是一份无聊的清单
这个月人人都发布了“智能体操作系统”——Fiserv、Experian、Microsoft,还有十几家创业公司。“OS”这个词听起来像是认真的基础设施,有时候确实是,但更多时候只是个起了个大名字的套壳产品。好消息是:有一份简短、不起眼的清单能区分这两者——而且它讲的正是我一直在写的那些东西。判断一个Agent OS,要看盒子里装了什么,而不是盒子上贴的标签。
- architecture
- agents
- business
2026年6月5日
智能体正进入“出错就是官司”的领域
本周 Experian 推出了一套面向信贷的 Agent OS(智能体操作系统)——由智能体来决定信贷、识别欺诈、判定谁有资格。在这些场景里,一次幻觉不再是聊天机器人尴尬的回复;它意味着一笔被拒的贷款、一次错误的医疗授权、一张传票。有一个数字点明了风险:AI 医疗拒赔在申诉时有 80% 以上被推翻——但提出申诉的人不到 1%。这就是为什么受监管领域会让关于智能体的整套论证真正变成法律。
- architecture
- business
- agents
2026年6月5日
微软派出 100 个智能体猎捕漏洞——说实话,聊聊 AI 对 AI 的安全
这周微软展示了一支完全由 AI 组成的安全团队:一条由 100 多个智能体组成的流水线,找出了 16 个新的 Windows 漏洞,其中四个是严重漏洞,还诞生了第一个能自动判定 malware 的 AI。防守方现在跑着自主 AI,攻击方也一样——有一个 AI 独立完成了一次真实入侵的 80–90%。今年春天,“AI 对 AI 的安全”不再只是一句口号。这是我诚实的判断:它是实打实的进步,也是一场更快到来的僵局。
- security
- agents
2026年6月5日
每台笔记本里都有一个 agent —— 以及 token 账单的终结
整个春天,所有人都在为 token 账单恐慌。这周 NVIDIA 给出了一个将在今秋落地的结构性答案:agent 搬进你的笔记本。RTX Spark 能在本地运行一个 1200 亿参数、上下文达一百万 token 的模型 —— 没有按 token 计费的电表,你的数据永不离开机器,而且处理那些轻快的活儿更快。它不会取代前沿,但它悄悄地一次性回答了今年最大的三个头疼问题。
- ai-native
- business
2026年6月5日
最好的安全 AI 如今被门禁式限制——按你不在名单上来做规划
今年春天,AI 跨过了一条线:Anthropic 的 Mythos 自己找出了数千个前所未见的零日漏洞,OpenAI 则推出了一款对黑客相关工作更宽松的“网络”模型。同一个能找出上千个漏洞来修补的模型,也能找出它们来加以利用——于是各大实验室把最好的安全模型放到了天鹅绒围栏(VIP 门槛)后面,只对经审核的合作伙伴和政府开放。这说得过去。但它也意味着,现在由一家厂商来决定谁能得到保护。这是写给所有不在名单上的人的实话。
- security
- business
2026年6月5日
一个联邦 AI 标准凌驾于五十个州之上——如果你做开发,这意味着什么
昨天,一份 269 页的两党法案出炉,它可能覆盖每个州的 AI 法律,新闻吵得很响。如果你用 AI 做开发,真正有用的问题不是政治,而是这是否改变了你实际要做的事。坦白说:比标题暗示的要少得多,因为真正约束你产品的规则,本就不是这份法案触及的。下面用大白话讲清楚两层的版本。
- business
- ai-native