ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月14日
你有的是一个智能体，不是 AI。
2026 年初发布或更新的企业应用中，80% 至少嵌入了一个 AI 智能体——而 2024 年这个数字还只是 33%。听起来人人都「搞定了 AI」。但嵌入一个智能体和从中获得价值，完全是两码事：智能体收回成本的中位数耗时是 5.1 个月，而大多数部署仍卡在试点阶段，从未真正铺开。如今拥有一个智能体只是入场券，就像拥有一个网站一样。真正拉开公司差距的，是这个智能体有没有进入生产、有没有创造价值、有没有被信任去独立运行。下面就是真正重要的那道分界线。
- business
- agents
2026年6月14日
现在，你的 AI 内容必须声明自己是 AI
2026 年 6 月 10 日，欧盟委员会发布了《人工智能生成内容标记与标注行为准则》——这是一套实操手册，对应的透明度规则将于 8 月 2 日依据欧盟人工智能法案正式具备强制执行力。深度伪造内容、以及涉及公共利益议题的 AI 撰写文本，都必须被清晰标注；人们也必须被告知自己正在和聊天机器人对话。这份准则本身是自愿的，但它背后的义务不是。披露正在成为默认选项，而这不只是一项合规杂务——它是一个关于信任的决定。下面说说这对所有正在交付 AI 内容的人意味着什么。
- business
- security
2026年6月13日
绿色对勾可能藏着一个坏掉的中间过程
这是在生产环境里吞掉 AI 智能体的失败模式：智能体跑一个多步骤任务，在中间某处拐错了弯，却照样给出一个能通过你检查的最终答案。输出看着干净，推理却是坏的。研究者发现这正是多步骤智能体出错的方式——第三步的一个错误，悄无声息地传进了第十步那份读起来没问题、实则错了的总结里。如果你只给最终答案打分，你对智能体真正出错的大部分方式都是瞎的。这篇讲清楚为什么，以及该改成检查什么。
- methodology
- agents
2026年6月13日
智能体正在变成一种功能，而不是一款产品
Gartner 预计，到 2026 年底，40% 的企业级应用会内嵌面向特定任务的 AI 智能体，而一年前这个比例还不到 5%。智能体式 AI 是增长最快的企业级优先事项，同比上升 31.5%。把这些数字放在一起看，会得出一个让很多创业公司不舒服的结论：智能体正在变成人们已经在用的软件里的一个功能，而不是一款值得他们专门切换过去的独立产品。如果你的全部卖点就是「我们做了一个能干 X 的智能体」，那么掌握 X 的那款应用很快也会把它做出来。这篇文章讲讲这意味着什么、以及你该做什么。
- business
- ai-native
2026年6月13日
优先选小模型
本能反应是把每个任务都丢给最大、最聪明的模型。但数据告诉你：这通常是个错误的默认选项。一个 70 亿参数的小模型比 700 亿到 1750 亿的大模型便宜 10 到 30 倍，微软的 Phi 用少 98% 的算力就达到了 GPT-3.5 级别的质量，而且已经有超过 20 亿部手机在本地运行能力不俗的模型，完全不碰云端。Gartner 预计到 2027 年，针对特定任务的小模型使用量将是通用大模型的三倍。这篇说说为什么「小模型优先」正在成为聪明的默认选择——以及什么时候还是该上大模型。
- ai-native
- business
2026年6月13日
AI Act 真正的大限是八月
2026年8月2日，欧盟 AI Act 针对高风险 AI 系统的义务正式生效——这才是真正有牙齿的部分：文档记录、人工监督、风险管理，以及最高 €35M 或全球营业额 7% 的罚款。有两件事让局面变得棘手。截至三月，27 个成员国里只有 8 个连执法对接点都还没设好。而当一个自主智能体擅自行动出了事，到底谁来担责，谁都没有一个干净的答案。如果你的软件触及欧盟用户，这里讲清楚到底有什么在变，以及你需要补上的那道缺口。
- business
- security