E S S A Y
做个会成长的AI
2026 · 05 · 17
你有没有带过新人?
入职那天,你花了两个小时教他用内部系统。第一周,他每三分钟问一次问题。一个月后,终于能独立处理大部分事情了。然后——他走了。下一个新人来了,一切从零开始。
你发现自己重复着同样的话,教着同样的坑,做着同样的培训。不是新人不聪明——是没有传承。
现在的 AI 就是那个新人。
每次对话都是一次全新的开始。你告诉它你的偏好,它记住了——只限于这场对话。关掉窗口,它又变回那个一脸茫然的实习生。没有积累,没有成长,没有"上次的经验这次能用上"。
你可能在想:上下文窗口不是越来越大吗?
是的。128K 也好,1M 也罢——那是同一场对话内。关掉对话,一切归零。就像新人学会了这个客户怎么对接,然后被派到了另一个项目组。
不是窗口不够大——是跨对话的记忆缺失。
这就是"自成长AI"要解决的问题——让 AI 能跨会话积累经验,像人一样从经验中学习,而不是用完即弃。
在 OpenClaw 社区,有一个叫做 Self-Improving Agent 的项目,已经累计 43 万下载。名字很学术,但核心思想很简单:
每次任务结束后,AI 会回顾自己刚才的表现——哪些做得好,哪些做得不好,学到了什么。然后把教训存进长期记忆。下一次面对类似任务时,它不再是从零开始。
想象一下带新人的场景,最累的是什么?不是教操作步骤——是教那些只有做过才知道的东西。"这个客户的邮件语气要更正式""那个接口虽然文档写的是 A 参数,但实际要传 B""这个错误提示看起来吓人,但其实重启一下就好"。
这些隐性知识,就是实践出真知。Self-Improving Agent 做的,就是让 AI 自己积累这些隐性知识。
它的成长机制,可以从三个层次来理解:
第一层:记忆系统
每次任务结束后,AI 把"这一局我学会了什么"写进一个长时存储区。这个存储区不是对话窗口——它跨会话存在。就像新人的工作笔记。
第二层:做梦机制
人睡觉时会做梦——大脑在整理白天的经历,把短期记忆转成长时记忆。AI 也需要这个。空闲时,它会回顾过去的对话,提取模式,压缩成可检索的知识。这就是它的 "REM 睡眠"。
第三层:发呆机制
这是最有趣的发现。当 AI 被要求严格遵循边界、不去主动优化某些范围时,它奖励自己"发呆 20 秒"。在这 20 秒里,它漫无目的地扫描代码库——结果找到了 10 个常规分析不会注意到的优化点。这种无目的探索,恰恰是创造力的来源。人类的默认模式网络(DMN)也是这样——你放空的时候,灵感反而来了。
这三个层次,恰好对应了人类成长的三种方式:
记笔记(记忆系统)—— 听完课后把重点写下来
睡觉做梦(做梦机制)—— 大脑默默整理今天的经历
上课走神(发呆机制)—— 放空时偶然想到的点子
人类就是靠这三种方式成长的。AI 也是。
这个项目 43 万的下载背后,说到底是一个判断:AI 的价值不止在于它能回答多少问题,更在于它能记住多少教训。
当前的 AI 行业,大家都在拼参数、拼窗口、拼推理能力。但有一个维度被忽略了——时间维度的学习。一个 AI 用了一年后,应该比一年前聪明。不是因为模型升级了,而是因为它在你的场景里、在你的数据上、在你的反馈中,一点一点变强了。
这才是真正的"越用越懂你"——不是一个营销话术,而是一个技术架构的选择。
我也在自己搭建的 AI 系统里做了类似的尝试。不是直接复刻 Self-Improving Agent,而是用它的思路改造了一套我自己的体系。
具体做了三件事:
建立跨会话记忆 — 每天的对话都会被压缩成结构化笔记,存进一个长期文件。下次启动时,AI 会先读"这个人昨天说了什么、关心什么"。
设定定期的"复盘"任务 — 每隔一段时间,AI 被要求回顾近期的对话记录,整理出规律和模式。就像每周五下午的团队复盘会。
保留"发呆时间" — 当任务完成得干净利落时,奖励它几分钟无目的探索。那些看似无用的发现,往往是最有价值的。
效果如何?
最明显的变化不是它知道得更多了——而是它越来越知道怎么跟我合作。它知道我偏好简洁的回答,知道我对哪些话题感兴趣,知道什么情况下需要追问、什么情况下该闭嘴。这些都不是我教它的——是它自己积累的。
就像那个新人,三个月后不再需要你教。他懂得察言观色,知道什么该问什么该自己查,甚至开始主动优化你都没注意到的工作流。
这个新人,终于学会了自己成长。
毕竟——
最好的AI不是天生聪明,
是越用越聪明。
巡梦人
从一颗星星开始,温暖整个宇宙