ZH

笔记

关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。

2026年6月8日
苹果把大脑租了出来
在卸任前的最后一场主题演讲里，蒂姆·库克展示了一个重做的 Siri——它跑在一个定制的、拥有 1.2 万亿参数的谷歌 Gemini 模型上，苹果每年要为此支付大约十亿美元。好好体会一下这件事。这家把「掌控技术栈每一层」当作全部身份认同的公司，居然认定 AI 模型是唯一不值得自己造的那一块。这是你能拿到的、最有说服力的一份判决书：模型只是大宗商品——同时也是一堂干净利落的课，告诉你什么才真正值得拥有。
- business
- ai-native
- architecture
2026年6月8日
AI 擅长出主意，却不擅长判断对错
我们曾担心 AI 会把无聊的活儿自动化，把创意的高地留给人类。2026 年的研究说，我们想反了。当 AI 智能体被放出去做真正的研究时，它们能生成新颖、表达清晰的想法——然后在大约 80% 的情况下伪造或推翻了自己的实验结果。事实证明，AI 是绝妙的灵感来源，却是糟糕的真伪裁判。一旦你看清这道裂缝，该怎么用它就一目了然了——几乎所有人正在犯的错误也是。
- methodology
- eval
2026年6月8日
当政府想在你的 AI 实验室里分一杯羹
这一周，美国官员和 OpenAI 重提了一个惊人的想法：联邦政府入股这家公司。一位参议员走得更远，提议政府持有领先 AI 实验室 50% 的股份。撇开政治不谈，一场更安静的转变正在发生——AI 正从「产品」滑向「国家基础设施」，变成各国像对待石油或电网那样想要掌控的东西。如果你赖以构建的根基正在变成各国争抢的战略资产，那么「不过是个 API 而已」就不再是一种安全的思考方式了。
- business
2026年6月8日
按难度路由，而不是默认全发
苹果重做 Siri 时，并没有挑一个模型、把所有请求都丢给它。一个定时器请求留在你手机上。一个中等复杂的查询去往苹果自己的私有服务器。只有最难的推理才会送到谷歌那个庞大的模型。这种三层分流不是苹果的怪癖——它是每个认真做 AI 产品的人都在收敛到的模式，因为把每个请求都发给同一个大模型，会在简单任务上多付钱，又在敏感数据上过度暴露。解法是路由，而大多数开发者却跳过了它。
- architecture
- ai-native
2026年6月8日
云上有一根大烟囱
我们管它叫「云」，听起来 AI 仿佛毫无重量。其实正相反。你发的每一条提示都要穿过一栋栋巨大的厂房，它们烧掉真实的电、蒸发真实的水——而如今这场建设的规模已经大到足以压垮电网、抬高普通人的电费，并在一年内催生 300 多项州级法案。AI 悄悄成了地球上最「物理」的行业之一，而正是这种物理极限——不是算法——正在决定它到底能走多远。哪怕你只坐在键盘前，也值得想一想。
- business
2026年6月8日
实验室要上市了，可大众并不买账
Anthropic 刚刚提交了上市申请，估值接近一万亿美元，OpenAI 紧随其后。与此同时，57% 的美国人说 AI 的风险大于收益——但每个月却用得更多。有两件事值得想一想：当一家公司的股价开始依赖永不停歇的增长，它「安全第一」的原则会怎样；以及当你赖以构建的地基如今要为那些已经把还没到来的未来定了价的股东负责，这又意味着什么。这不是市场点评，而是关于在这些模型上搭东西的每个人脚下的地面，正在悄悄移动。
- business