笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年7月1日
语音 agent 终于跨过了延迟这道线
多年来,AI 语音 agent 一直栽在同一件事上:停顿。你说完话之后那半秒的死寂,让每一个电话机器人都感觉像坏了。到了 2026 年,停顿消失了——端到端的语音流式传输、40 毫秒的全新 state-space 语音模型,以及低于 500 毫秒的往返时延,把语音送进了对话感觉真实的那个窗口。模型从来都不是难的部分。难的是时机——而现在时机是一个工程问题,不是一个研究问题。
- ai-native
- agents
2026年6月23日
赢的不是最好的模型,是默认的那个。
ChatGPT 首次跌破 AI 助手市场的 50%,而一年半前还是 65%。Gemini 一路猛涨,最大的原因不是它更聪明,而是 Gemini 是默认选项,内建在 Android 和 Google Workspace 里。对所有做 AI 产品的人来说,这就是那条教训:分发几乎每次都能赢过模型。
- ai-native
- business
2026年6月23日
你赖以构建的工具刚刚被收购了
SpaceX 正在以 600 亿美元股票收购 Cursor——如今许多团队整天泡在里面的 AI 编程工具——就在史上最大规模 IPO 之后几天。这是有史以来对风投支持创业公司的最大一笔收购。对构建者来说,教训不在价签上。而在于:支撑你整个工作流的工具,可能一夜之间换了主人,你应该为此做好准备。
- business
- ai-native
2026年6月19日
Apple 把模型变成了一个设置项
在本月的 WWDC 上,Apple 把 Siri 重建在了 Google 的 Gemini 之上——然后又让你能换成 Claude 或 ChatGPT。地球上垂直整合程度最高的公司,刚刚把 AI 模型变成了一个下拉菜单。这是迄今为止最清晰的信号:模型是一个可替换的零件,而不是护城河——而你也应该完全照这个思路来构建。
- architecture
- ai-native
2026年6月19日
搜索不再给你送流量了
Google AI Mode 现在基于 Gemini 3.5 Flash 直接在页面里给出答案,点击正在蒸发:一项研究发现,在出现 AI 答案的访问中,人们只在大约 8% 的情况下点击链接,而没有 AI 答案时大约是 15%。如果没人点进来,排第一也没什么意义。游戏正在从「在页面上拿排名」转向「成为答案所依据的来源」。
- ai-native
- business
2026年6月19日
瓶颈搬到了电网
OpenAI 与 NVIDIA 敲定了 10 吉瓦、又与 AMD 敲定了 6 吉瓦;一座 Stargate 数据中心刚在密歇根获批 1.4 吉瓦,无视当地居民的强烈反对。AI 的约束早就不再是模型了。它是电力、土地,以及围绕二者的政治。这重新定义了效率值多少钱,而这正是支配着远比数据中心小得多的系统的同一条规律。
- architecture
- ai-native