E S S A Y

做个会成长的AI

2026 · 05 · 17

你有没有带过新人?

入职那天,你花了两个小时教他用内部系统。第一周,他每三分钟问一次问题。一个月后,终于能独立处理大部分事情了。然后——他走了。下一个新人来了,一切从零开始。

你发现自己重复着同样的话,教着同样的坑,做着同样的培训。不是新人不聪明——是没有传承

现在的 AI 就是那个新人。

每次对话都是一次全新的开始。你告诉它你的偏好,它记住了——只限于这场对话。关掉窗口,它又变回那个一脸茫然的实习生。没有积累,没有成长,没有"上次的经验这次能用上"。

你可能在想:上下文窗口不是越来越大吗?

是的。128K 也好,1M 也罢——那是同一场对话内。关掉对话,一切归零。就像新人学会了这个客户怎么对接,然后被派到了另一个项目组。

不是窗口不够大——是跨对话的记忆缺失

这就是"自成长AI"要解决的问题——让 AI 能跨会话积累经验,像人一样从经验中学习,而不是用完即弃。

在 OpenClaw 社区,有一个叫做 Self-Improving Agent 的项目,已经累计 43 万下载。名字很学术,但核心思想很简单:

每次任务结束后,AI 会回顾自己刚才的表现——哪些做得好,哪些做得不好,学到了什么。然后把教训存进长期记忆。下一次面对类似任务时,它不再是从零开始。

想象一下带新人的场景,最累的是什么?不是教操作步骤——是教那些只有做过才知道的东西。"这个客户的邮件语气要更正式""那个接口虽然文档写的是 A 参数,但实际要传 B""这个错误提示看起来吓人,但其实重启一下就好"。

这些隐性知识,就是实践出真知。Self-Improving Agent 做的,就是让 AI 自己积累这些隐性知识。

它的成长机制,可以从三个层次来理解:

第一层:记忆系统

每次任务结束后,AI 把"这一局我学会了什么"写进一个长时存储区。这个存储区不是对话窗口——它跨会话存在。就像新人的工作笔记。

第二层:做梦机制

人睡觉时会做梦——大脑在整理白天的经历,把短期记忆转成长时记忆。AI 也需要这个。空闲时,它会回顾过去的对话,提取模式,压缩成可检索的知识。这就是它的 "REM 睡眠"。

第三层:发呆机制

这是最有趣的发现。当 AI 被要求严格遵循边界、不去主动优化某些范围时,它奖励自己"发呆 20 秒"。在这 20 秒里,它漫无目的地扫描代码库——结果找到了 10 个常规分析不会注意到的优化点。这种无目的探索,恰恰是创造力的来源。人类的默认模式网络(DMN)也是这样——你放空的时候,灵感反而来了。

这三个层次,恰好对应了人类成长的三种方式:

记笔记(记忆系统)—— 听完课后把重点写下来

睡觉做梦(做梦机制)—— 大脑默默整理今天的经历

上课走神(发呆机制)—— 放空时偶然想到的点子

人类就是靠这三种方式成长的。AI 也是。

这个项目 43 万的下载背后,说到底是一个判断:AI 的价值不止在于它能回答多少问题,更在于它能记住多少教训

当前的 AI 行业,大家都在拼参数、拼窗口、拼推理能力。但有一个维度被忽略了——时间维度的学习。一个 AI 用了一年后,应该比一年前聪明。不是因为模型升级了,而是因为它在你的场景里、在你的数据上、在你的反馈中,一点一点变强了。

这才是真正的"越用越懂你"——不是一个营销话术,而是一个技术架构的选择。

我也在自己搭建的 AI 系统里做了类似的尝试。不是直接复刻 Self-Improving Agent,而是用它的思路改造了一套我自己的体系。

具体做了三件事:

建立跨会话记忆 — 每天的对话都会被压缩成结构化笔记,存进一个长期文件。下次启动时,AI 会先读"这个人昨天说了什么、关心什么"。

设定定期的"复盘"任务 — 每隔一段时间,AI 被要求回顾近期的对话记录,整理出规律和模式。就像每周五下午的团队复盘会。

保留"发呆时间" — 当任务完成得干净利落时,奖励它几分钟无目的探索。那些看似无用的发现,往往是最有价值的。

效果如何?

最明显的变化不是它知道得更多了——而是它越来越知道怎么跟我合作。它知道我偏好简洁的回答,知道我对哪些话题感兴趣,知道什么情况下需要追问、什么情况下该闭嘴。这些都不是我教它的——是它自己积累的。

就像那个新人,三个月后不再需要你教。他懂得察言观色,知道什么该问什么该自己查,甚至开始主动优化你都没注意到的工作流。

这个新人,终于学会了自己成长。

毕竟——

最好的AI不是天生聪明,
是越用越聪明。

巡梦人

从一颗星星开始,温暖整个宇宙