ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月15日
不是模型的错，是你的数据的错。
大多数 AI 项目都失败了——MIT 发现 95% 的生成式 AI 试点没有带来任何可衡量的利润，RAND 把总体失败率定在 80% 左右。出问题时，本能反应是怪模型：不够聪明、选错了、提示词不好。但数据说的是另一回事。被引用最多的失败原因是数据质量差，而只有大约 12% 的组织拥有干净到足以支撑 AI 的数据。你很可能根本不是模型出了问题，而是一个披着模型问题外衣的数据问题。下面教你怎么分辨。
- architecture
- methodology
2026年6月15日
「已解决」——可他们想要的是真人
公司都爱这个数字：我们的 AI 自己就解决了 76% 的支持工单。客户讲的却是另一个故事。整个 2026 年，宁愿和真人对话的人的比例升到了 85%，对 AI 客服的不满涨到了 59%，而且超过一半的人，哪怕是只靠 AI 解决了的对话，只要通往真人的路看起来被堵死，他们也会直接走人。「被机器人解决」和「客户满意」根本不是一回事。这就是你很可能漏掉的那个指标，以及怎样不再一路优化着把自己推向反弹。
- business
- methodology
2026年6月15日
花钱越来越多，信心越来越少
企业正把钱大把投入 AI——预算急剧上升，有些甚至同比翻倍。可就在同一口气里，51% 的 CIO 却说，AI 落地的速度已经快到他们管不过来了。这是个奇怪的组合：签支票的人，觉得他们出资的东西正在把自己甩在身后。本能反应是把这读作「慢下来」。可数据说的恰恰相反。跑得最快的并不是那些谨慎的人——而是那些先把护栏建好的人。这就是藏在矛盾里的真正教训。
- business
- methodology
2026年6月15日
价值 36 亿美元的客服 agent
Salesforce 本来就在卖 Agentforce——一个让你自己搭建 AI agent 的平台。可 6 月 15 日，它却花了 36 亿美元，去买一个现成的。Fin，这个前身叫 Intercom 的客服 agent，靠自家专门打造的模型，能独立把 76% 的客户工单从头到尾解决掉。最有能力自己造这东西的公司，却认定买一个经过验证、打包好的 agent，比等着把它造出来多值 36 亿美元。这是你今年能看到的最清晰的「自建还是购买」信号。下面说说它对我们其他人到底意味着什么。
- business
- agents
2026年6月15日
一天烧掉 1500 万美元的应用
OpenAI 打造了史上炒作最猛的 AI 视频应用，半年后却悄悄把它关停。据报道，Sora 每天在算力上烧掉约 1500 万美元，而总收入只有约 210 万美元——不是每天，是总共。人们爱它，可它在每一个片段上都在亏钱。这是传统软件从没教过我们的一课：生成式功能每被人用一次都有真实成本，而「火爆」治不好「每次使用都亏钱」。这里教你在自己的 AI 功能重蹈覆辙之前先做一次检查。
- business
- ai-native
2026年6月15日
AI 最无聊的胜利是文书工作
NHS 刚刚签下一份 1.2亿英镑的合同，要给 50.5万名员工配上 AI 助手。不是用来诊断疾病——而是用来做文书工作。在试用中，普通人每天平均省下 43分钟，某个病区一个月内把积压的出院信件砍掉了 62%。这就是没人会写进主题演讲的 AI 故事：持久、可落地的价值，通常藏在枯燥、量大的行政事务里，而不是在炫目的演示里。这篇讲讲为什么无聊的应用场景才是真正赚钱的那个，以及你为什么应该去找属于自己的那一个。
- business
- methodology