ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月11日
Shadow AI 才是你真正的数据泄露
当公司设想一次 AI 安全事件时，他们脑子里想的是失控的模型或被攻陷的智能体。但大多数公司真正发生的泄露要平淡得多：员工把机密数据粘贴进没人批准过的 AI 工具里。71% 的员工在工作中用过未经批准的 AI，57% 还刻意瞒着，五分之一的组织已经因此出过一次泄露事件——每次平均多花约 67 万美元。解决办法不是封禁。封禁恰恰是它藏起来的原因。
- security
- business
2026年6月11日
你已经分不清什么是真的了
一项最新调查发现，85% 的人说自己已经无法分辨真实内容和 AI 生成的内容——一年前这个数字还是 66%。84% 的人说「有说服力的视频证据」已经不再让人觉得那是铁证。整个互联网赖以运转的默认假设——我看到的就是真的——刚刚对几乎所有人都失效了。这不只是诈骗问题。它悄悄改变了每个产品必须去做的事：当真实性无法被默认时，信任就不再免费，而变成了你必须亲手去建立的东西。
- security
- business
2026年6月10日
「托管 agent」很方便，直到你想走却走不了
谷歌、Anthropic 和其他厂商正在推销 AI 领域最容易上钩的卖点：一次 API 调用，我们就帮你把整个 agent 跑起来——sandbox、工具、记忆、状态，全都在我们的基础设施上。这确实很方便，做个原型时尤其香。但要看清你刚刚交出去的是什么。托管的模型 API 租给你的是大脑，大脑随时可以换掉。托管的 agent 租给你的是产品的整套神经系统，这个钩子要深得多。在这里，便利和锁定其实是同一笔交易——只是账单会晚一点才来。
- business
- architecture
2026年6月10日
一个模型搞定一切的时代正在落幕
微软一口气发布了七个 AI 模型——不是一个更大的大脑,而是一个推理模型、一个编程模型、一个转写模型、一个语音模型,以及更多,每个都为单一任务而生。与此同时,前沿通用模型还在不断变强。这两件事同时成立,而它们之间的落差才是关键:头条上的竞赛比的是一个模型能不能包揽一切,但真正能在生产环境里跑通的,是一套精挑细选的专家组合。如今再问『哪个模型最好』,已经是问错了问题。
- ai-native
- architecture
2026年6月10日
风险从来不在模型本身,而在它周围的系统
全球最权威的 AI 安全机构——由 Yoshua Bengio 牵头、三十多个政府背书、上百位专家参与——刚刚得出一个让人有点泄气的结论:最紧迫的 AI 风险,与其说来自模型本身,不如说来自公司围绕模型搭建的系统。不是科幻片里失控的超级智能,而是那些集成、权限、业务流程——一个小错误会顺着它们传播开来。对于做产品的人来说,这其实是好消息,因为它意味着 AI 安全大体上是一件你真的能动手去做的事。
- architecture
- security
2026年6月10日
为什么你的智能体提交的 pull request 被拒了
研究者分析了 33000 个由 AI 编程智能体写的 pull request，大约 29% 始终没能合并。有意思的是原因：多数不是因为代码写错了，而是因为这个 PR 是个糟糕的协作产物——太大、改动太多文件、把不相关的改动捆在一起、CI 不过、自己又解释不清楚。让代码被接受，原来是一项和写代码完全不同的技能，而这恰恰是智能体默认不具备的技能。这对我们怎么用它们意味着什么，下面就讲。
- methodology
- agents