笔记
关于我所交付的 AI 系统背后方法论与架构决策的短文——规约、评估、多智能体编排、LLM 集成,以及调度编程智能体的纪律。
2026年6月7日
看不见的智能体,你根本没法运行
思科今年的一项调查发现,大多数公司正在运行自己无法妥善监控的智能体。一句话就道出了全部问题。智能体的失败方式和普通软件不一样——它会返回一个漂漂亮亮的成功,背地里却悄悄做错了事,而你只能在它行为的完整轨迹里看到,而不是在最终输出里。「智能体可观测性」之所以在 2026 年成为一门独立学科,原因正在于此。看清你的智能体到底做了什么——这个不起眼的能力,正在成为试点和生产之间的那条分界线。
- methodology
- agents
- architecture
2026年6月6日
氛围编程的时代结束了。难的从来不是做出demo。
谷歌如今在一门免费的五天课程里,向一百多万人传授氛围编程。当你引以为傲的东西变成一堂周末课,这项技能就不再是你的优势了。但标题没说的那部分才是关键:氛围编程一直擅长那容易的80%——也就是demo——却对决定软件能否存活的那20%束手无策。如今真正稀缺的技能不是生成代码,而是判断你拿到的代码到底好不好的眼力。
- careers
- methodology
- ai-native
2026年6月6日
氛围编程把应用和漏洞一起发了出去
一个叫 Moltbook 的 AI 社交网络在一月份上线,创始人得意地宣称自己『一行代码都没写』。三天后,研究人员发现它的整个数据库对全世界敞开着——150 万个认证令牌、3.5 万个邮箱、私信,全都裸奔在外。这不是什么离奇意外。研究一次又一次发现,大约 45% 的 AI 生成代码带着已知漏洞发了出去。演示现在免费了,但安全审查仍然是你没法靠氛围糊弄过去的那一步——而跳过它的账单,得由别人的数据来付。
- security
- methodology
- ai-native
2026年6月6日
你的 IDE 已经不再是你写软件的地方了
Mistral 刚刚发布了一种编码模式:你从 Slack 启动一次构建,代理在云端沙箱里干活,而你的笔记本是关着的,最后你拿回一个待审查的 pull request。Cursor 和其他家也在做同样的事。编辑器——那个我们一直当作软件诞生之地的东西——正悄悄沦为众多触发入口中的一个。工作正从窗口里的一次次敲键,转向你下派的任务和你评判的 diff。这件事对这份职业的改变,比听上去要大得多。
- methodology
- ai-native
- agents
2026年6月6日
Salesforce 承认了:你的工作流是为人设计的,不是为智能体设计的
Salesforce 刚推出了一整款产品,去修补企业 AI 屡屡卡壳的根源,而它的诊断才是最诚实的部分:智能体失败不是因为模型不会推理,而是因为底层的工作流从来就不是为一台会照字面执行指令的机器准备的。你的流程里满是缺口,人会悄悄补上,智能体却会直接掉下去。这才是没人愿意做的真活,再升级模型也修不好。
- architecture
- methodology
- agents
2026年6月5日
“我们先把哪一块智能体化(agentize)?”是个错误的第一个问题
整个市场已经从“agent 是真的吗?”转向了“我公司的哪一块先被智能体化?”——IT 支持、销售、对账。这听起来像是聪明的战略问题。其实它是错的。问该把 agent 指向哪里,跳过了真正决定一切能否成立的两个问题:agent 站在什么之上,以及它出错时谁来负责。下面是真正重要的顺序。
- methodology
- business
- agents