笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月14日
那个快模型,突然变聪明了
两年来,每次选模型你都得做个取舍:要么又快又便宜,要么又聪明又慢。Gemini 3.5 Flash 刚刚打破了这个规则。这个『Flash』档——本该是便宜又快的那一档——如今在 Artificial Analysis Intelligence Index 上拿下 55 分,领先 Grok 4.3 和 Claude Sonnet 4.6,同时跑出每秒超过 280 个 token 的速度。快模型不再是笨模型。这应该让你重新打开一个大多数团队一年前悄悄冻结的决定:你的默认模型是哪个,它现在还是对的吗?这篇讲讲该怎么想——也包括那个坑。
- ai-native
- business
2026年6月13日
智能体正在变成一种功能,而不是一款产品
Gartner 预计,到 2026 年底,40% 的企业级应用会内嵌面向特定任务的 AI 智能体,而一年前这个比例还不到 5%。智能体式 AI 是增长最快的企业级优先事项,同比上升 31.5%。把这些数字放在一起看,会得出一个让很多创业公司不舒服的结论:智能体正在变成人们已经在用的软件里的一个功能,而不是一款值得他们专门切换过去的独立产品。如果你的全部卖点就是「我们做了一个能干 X 的智能体」,那么掌握 X 的那款应用很快也会把它做出来。这篇文章讲讲这意味着什么、以及你该做什么。
- business
- ai-native
2026年6月13日
优先选小模型
本能反应是把每个任务都丢给最大、最聪明的模型。但数据告诉你:这通常是个错误的默认选项。一个 70 亿参数的小模型比 700 亿到 1750 亿的大模型便宜 10 到 30 倍,微软的 Phi 用少 98% 的算力就达到了 GPT-3.5 级别的质量,而且已经有超过 20 亿部手机在本地运行能力不俗的模型,完全不碰云端。Gartner 预计到 2027 年,针对特定任务的小模型使用量将是通用大模型的三倍。这篇说说为什么「小模型优先」正在成为聪明的默认选择——以及什么时候还是该上大模型。
- ai-native
- business
2026年6月13日
把它写下来给机器看
现在每个正经的编程智能体在动你的仓库之前,都会先读一个纯文本文件:AGENTS.md。截至 2026 年初,它已被 Claude Code、OpenAI 的 Codex CLI、Cursor、Aider、Devin、GitHub Copilot、Gemini CLI、Windsurf 和 Amazon Q 原生读取——这是业界目前最接近通用智能体指令格式的东西。它是当下你在 AI 编程上能花出去回报最高的一小时,可几乎没人去做。这篇讲清楚里面写什么、为什么管用。
- methodology
- ai-native
2026年6月12日
ChatGPT 不再是默认选项
一年前,「AI」基本上就等于 ChatGPT —— 它占了所有聊天机器人流量的大约四分之三,模型层几乎是垄断。到 2026 年 6 月,它已经降到 54.7%,Gemini 飙升到 27.4%(半年里涨了约 104%),剩下的由 Claude、Grok 和一长串小玩家瓜分。单一文化结束了,这会改变你该怎么选 —— 也改变你该怎么做产品。「最好的 AI」现在是一个按任务而定的问题,而把你的产品押在单一供应商身上,刚刚变得更危险了。
- ai-native
- business
2026年6月11日
会记忆的智能体
2026 年智能体最大的突破不是更聪明的模型,而是记忆。谷歌的 ReasoningBank 让智能体从自己的成败中学习,把推理过程存下来,并随着时间推移变得越来越强。这是一次跃迁:从每天早上重置的工具,变成一个会复利成长的同事。但记忆有第二面刃:它把每一个错误都变成长期错误。一个错误的事实、一条被投毒的指令,或者一个悄悄过期的认知,如今会跨会话存活下来,日后反噬你。记忆不是一个开关,而是一个你必须治理的语料库。
- ai-native
- agents