笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月14日
你有的是一个智能体,不是 AI。
2026 年初发布或更新的企业应用中,80% 至少嵌入了一个 AI 智能体——而 2024 年这个数字还只是 33%。听起来人人都「搞定了 AI」。但嵌入一个智能体和从中获得价值,完全是两码事:智能体收回成本的中位数耗时是 5.1 个月,而大多数部署仍卡在试点阶段,从未真正铺开。如今拥有一个智能体只是入场券,就像拥有一个网站一样。真正拉开公司差距的,是这个智能体有没有进入生产、有没有创造价值、有没有被信任去独立运行。下面就是真正重要的那道分界线。
- business
- agents
2026年6月14日
现在,你的 AI 内容必须声明自己是 AI
2026 年 6 月 10 日,欧盟委员会发布了《人工智能生成内容标记与标注行为准则》——这是一套实操手册,对应的透明度规则将于 8 月 2 日依据欧盟人工智能法案正式具备强制执行力。深度伪造内容、以及涉及公共利益议题的 AI 撰写文本,都必须被清晰标注;人们也必须被告知自己正在和聊天机器人对话。这份准则本身是自愿的,但它背后的义务不是。披露正在成为默认选项,而这不只是一项合规杂务——它是一个关于信任的决定。下面说说这对所有正在交付 AI 内容的人意味着什么。
- business
- security
2026年6月13日
绿色对勾可能藏着一个坏掉的中间过程
这是在生产环境里吞掉 AI 智能体的失败模式:智能体跑一个多步骤任务,在中间某处拐错了弯,却照样给出一个能通过你检查的最终答案。输出看着干净,推理却是坏的。研究者发现这正是多步骤智能体出错的方式——第三步的一个错误,悄无声息地传进了第十步那份读起来没问题、实则错了的总结里。如果你只给最终答案打分,你对智能体真正出错的大部分方式都是瞎的。这篇讲清楚为什么,以及该改成检查什么。
- methodology
- agents
2026年6月13日
智能体正在变成一种功能,而不是一款产品
Gartner 预计,到 2026 年底,40% 的企业级应用会内嵌面向特定任务的 AI 智能体,而一年前这个比例还不到 5%。智能体式 AI 是增长最快的企业级优先事项,同比上升 31.5%。把这些数字放在一起看,会得出一个让很多创业公司不舒服的结论:智能体正在变成人们已经在用的软件里的一个功能,而不是一款值得他们专门切换过去的独立产品。如果你的全部卖点就是「我们做了一个能干 X 的智能体」,那么掌握 X 的那款应用很快也会把它做出来。这篇文章讲讲这意味着什么、以及你该做什么。
- business
- ai-native
2026年6月13日
优先选小模型
本能反应是把每个任务都丢给最大、最聪明的模型。但数据告诉你:这通常是个错误的默认选项。一个 70 亿参数的小模型比 700 亿到 1750 亿的大模型便宜 10 到 30 倍,微软的 Phi 用少 98% 的算力就达到了 GPT-3.5 级别的质量,而且已经有超过 20 亿部手机在本地运行能力不俗的模型,完全不碰云端。Gartner 预计到 2027 年,针对特定任务的小模型使用量将是通用大模型的三倍。这篇说说为什么「小模型优先」正在成为聪明的默认选择——以及什么时候还是该上大模型。
- ai-native
- business
2026年6月13日
AI Act 真正的大限是八月
2026年8月2日,欧盟 AI Act 针对高风险 AI 系统的义务正式生效——这才是真正有牙齿的部分:文档记录、人工监督、风险管理,以及最高 €35M 或全球营业额 7% 的罚款。有两件事让局面变得棘手。截至三月,27 个成员国里只有 8 个连执法对接点都还没设好。而当一个自主智能体擅自行动出了事,到底谁来担责,谁都没有一个干净的答案。如果你的软件触及欧盟用户,这里讲清楚到底有什么在变,以及你需要补上的那道缺口。
- business
- security