笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月7日
对长时间运行的智能体来说,每个任务的成本才是唯一的基准
英伟达新推出的 Nemotron 3 Ultra 卖点不是「最聪明的模型」,而是「连续跑好几个小时也便宜」——专为那些要做规划、调用工具、跨上百轮推理的智能体打造。这个定位才是真正值得关注的事。当一个智能体长时间运行,真正重要的数字就不再是基准跑分或每个 token 的单价,而是「完成一个任务要花多少钱」。两个 token 单价相同的模型,在真实任务上的开销可能差出两倍。下面说说,为什么一旦你的智能体运行时间超过一瞬间,排行榜就成了错误的选购依据。
- ai-native
- business
- eval
2026年6月7日
直接接入实时数据的 low-code 智能体
SAP 全新的 Joule Studio 能从一句话生成一整个智能体——工作流、规格说明,甚至连评估套件都有,而且直接扎根于你的实时业务数据。OutSystems 也做了类似的东西。这确实很强:业务分析师现在不用排在工程队列里等,就能在生产系统上立起一个智能体。但这也正是你如何造出一个爆炸半径巨大、却没人能解释、没人能叫停的智能体。门槛降低是真的,危险也是真的,而大多数公司还没为后半句做好准备。
- architecture
- business
- security
2026年6月7日
65% 的公司已经遭遇过一次智能体安全事故
三分之二的组织已经发生过一起涉及 AI 智能体的安全事故——这不是罕见的灾难,而是再平常不过的一个周二。而原因并不是某个失控、目标错位的模型干了坏事。是一个行为完全正常的智能体,访问了它本就不该被授予的数据。2026 年的智能体泄露事件很无聊:它只是一个权限过大的身份,在做它被允许做的事。这其实是好消息,因为无聊的问题有无聊的解法——只要你把智能体当成它本来的样子来对待。
- security
- architecture
- business
2026年6月7日
「都是 AI 干的」是甩锅的新姿势
今年春天,美国大约每四起裁员里就有一起把 AI 拉出来当理由,连山姆·奥特曼都承认,公司在甩锅给 AI 时「根本不管是不是真和 AI 有关」。分析师给这套路起了名字:AI 洗白。但同样的把戏正悄悄渗进我们运行智能体的方式里——一旦出岔子,「是智能体决定的」就成了责任葬身之地。机器扛不起问责,扛责任的永远是人。你把真正的决策权交给智能体时,这件事会越来越要紧。
- business
- agents
- careers
2026年6月7日
美国最严的 AI 法律还没生效就被改写了
科罗拉多州的 AI 法案本该是那部重磅大法——美国第一部全面的 AI 法律,2026 年落地,带着防止算法歧视的实打实义务。然后一位法官把它冻结了,立法机构把它掏空了,整件事被推迟到 2027 年,牙齿也被拔光了。如果你当初手忙脚乱地去合规那个如今已死的版本,你刚刚学到了关于「为 AI 监管做开发」的真正一课:别为截止日期做开发。为那些每次改写都能存活下来的少数几条义务做开发,因为那几条本来就只是好的工程实践而已。
- business
- methodology
2026年6月7日
你摆脱了模型锁定。他们把锁定挪到了你的上下文里。
让模型可以随时替换,是今年最大的胜利——现在改一行配置就能换供应商。于是在 Build 2026 上,微软不慌不忙地把锁定挪到了你换不掉的地方:你公司的上下文。Work IQ、Fabric IQ、Foundry IQ——你公司的记忆、权限和含义,全都活在供应商对你业务的理解之中。正如一位分析师所说:你可以换大脑,但你未必能换记忆。这就是新的陷阱,以及如何让真正重要的那部分保持可迁移。
- architecture
- business
- ai-native