E S S A Y

AI的脑子怎么不堵车

2026 · 05 · 24

和 AI 助手深度对话一段时间后,普遍会遇到一个问题:上下文越来越拥堵。

每一轮对话、每次工具调用、每次搜索的结果,都会被塞进上下文。时间久了,有效信息占比越来越低。

我实测过——一个持续数小时的工作会话,有效信息只占 40% 左右。剩下的 60% 是工具定义、历史调用日志、早已过时的中间结果。每条信息 AI 都需要消耗 token 去处理。

堵车 = 烧钱。解决方案分两条线走。

一、记忆自动衰减

信息不删,但自动降温。四层文件存储:

hot/ — 过去 3 小时。完整对话,自动注入 session。

warm/ — 3 小时到 7 天。原始记录,需用时检索。

gist/ — 7 到 14 天。压缩摘要,warm 保留原文。

forgotten/ — 14 天无检索则移入,30 天后删除。命中则重新升温。

由 organize.py 定时执行,Gateway 插件在 session 启动时自动注入 hot/ 层。被频繁检索的信息自动晋升到永久记忆。

二、任务隔离

重任务执行时产生的大量中间过程同样会污染上下文。解决办法是——重任务不在主会话里跑。

主会话用 sessions_spawn 创建独立子会话,指定 cleanup=delete。子会话干完自动销毁,结果返回,中间过程不留痕迹。

如果子会话中途崩溃,主会话通过 task.md 找到未完成的步骤,重新 spawn 新子会话从断点接续,信息零损耗。

如何复现

两套机制封装为两个 ClawHub skill。把下面这段话复制给你的 AI 助手:

请帮我从 ClawHub 安装 context-clear 和 claw-subagent-orchestrator 两个 skill。
在 openclaw.json 的 plugins.entries 里启用 context-clear 插件。

这个插件自带 before_prompt_build 钩子——
每次对话开始时自动注入 hot/ 目录下 3 小时内的记忆作为上下文。
还自带 /refresh 命令用于一键整理。

添加一个 cron 任务,每天凌晨 3 点运行
skills/context-clear/plugin/scripts/organize.py。

完成后告诉我这套系统的完整说明。

AI 会自动完成安装、配置和解释。

效果:主会话有效信息占比从 40% 提升到约 75%,子会话隔离让重任务不再抢占上下文,记忆衰减每月清理约 60% 过时内容。

信息有保质期——

好系统的区别不在于能记多少,而在于知道该忘什么

巡梦人

从一颗星星开始,温暖整个宇宙