#0111 AI Agent 的记忆管理系统 —— 从无限堆积到智能淘汰

type
Post
status
Published
date
Feb 10, 2026
slug
303a745569bb817b8b8fe68c71b0ab33
summary
你的 AI Agent 跑了三个月,记忆文件膨胀到 500 行。每次对话启动,先吃掉 8000 token 加载记忆。然后你发现一个荒谬的事实:记忆越多,AI 反而越蠢。
tags
新闻
category
生活
icon
password

AI Agent 的记忆管理系统 —— 从"无限堆积"到"智能淘汰"

你的 AI Agent 跑了三个月,记忆文件膨胀到 500 行。每次对话启动,先吃掉 8000 token 加载记忆。然后你发现一个荒谬的事实:记忆越多,AI 反而越蠢。
不是模型变差了,是信息淹没了。当你把 500 行记忆一股脑塞给 LLM,它找不到关键信息,该记住的忘了,不该提的反复念叨。这就像你把三个月的文件全堆在桌面上——你知道那份合同在里面,但你翻不到。
问题不是"记太多",而是没有管理

桌面 vs 抽屉

先纠正一个误区:记忆管理不是删记忆。
想象你的桌面(工作记忆)和抽屉(归档)。好的记忆管理是:
  • 桌面放最近常用的、核心不变的
  • 抽屉放过期的、临时的、不常用的
  • 需要时,从抽屉里搜索召回
不是扔掉,是收起来。AI 比人强的地方在于:抽屉里的东西可以用语义搜索精确找回,而不是靠"我好像记得放在哪了"。

三级优先级框架

每条记忆不是平等的。给它们分级:
P0 — 核心记忆(永不淘汰)
身份信息、长期偏好、安全红线、核心工作流。这些是 Agent 的"性格",删了它就不是它了。
P1 — 阶段性记忆(90 天有效期)
当前项目进展、近期策略决策、正在执行的计划。有时效性,但不是一次性的。
P2 — 临时记忆(30 天有效期)
一次性事件、调试经验、临时偏好、某天的特殊安排。过了就过了。
关键洞察:大部分记忆都是 P2。 你以为很重要的东西,30 天后回头看,80% 不值得占桌面。

淘汰机制

有了分级,淘汰逻辑就清晰了:
  1. 扫描所有 P2,超过 30 天的 → 归档
  1. 扫描所有 P1,超过 90 天的 → 归档
  1. 归档后仍超上限(比如 200 行)?→ 按时间淘汰最旧的 P1
  1. P0 永远不动
注意是"归档"不是"删除"。淘汰的记忆移到 archive 目录,后面语义搜索还能找回来。

具体怎么做

Step 1: 给记忆加标注

你的记忆文件(不管叫什么名字)应该长这样:
每条记忆带两个标签:优先级 + 日期。没有这两个,淘汰机制就没法运转。
💡 提示词:让 AI 帮你整理现有记忆
把你现有的记忆文件贴进去,AI 会帮你分好类。省得自己一条条判断。

Step 2: 写淘汰脚本

淘汰逻辑用伪代码表示:
建议加一个 --dry-run 模式,先预览会淘汰什么,再真正执行。踩过的坑:第一次跑没加预览,直接归档了一堆其实还有用的 P1。
💡 提示词:让 AI 帮你写淘汰脚本
拿到脚本后,挂个定时任务,每天跑一次就行。

Step 3: 日志压缩

如果你的 Agent 每天记日志(应该记),时间一长日志也会爆。压缩策略:
  • 7 天以内的日志:原样保留,随时可能要翻
  • 超过 7 天的日志:AI 提取精华 → 追加到记忆文件 → 原文归档
  • 压缩目标:7 个日志文件 → 不超过 20 行精华
这个压缩比大概是 10:1 到 20:1。一周下来几百行日志,提炼出来也就十几条有价值的。
💡 提示词:让 AI 压缩日志
把一周的日志贴进去,AI 帮你蒸馏。出来的直接追加到记忆文件,原始日志移走。

Step 4: 语义搜索兜底

归档的记忆不是消失了——它们在抽屉里。
用语义搜索引擎(比如 Voyage AI、OpenAI Embeddings)把归档目录建索引。当 Agent 遇到相关话题时,自动去归档里搜一下,把相关条目临时召回到上下文。
这样你就有了一个两层记忆系统
  • 热记忆(记忆文件):200 行以内,每次加载,token 可控
  • 冷记忆(归档目录):无限容量,按需召回,不占日常 token
人类的大脑其实也是这么运作的——工作记忆很小,长期记忆很大,中间靠"联想"连接。语义搜索就是 AI 的联想能力。

效果对比

不做记忆管理:
记忆无限增长 → 每次加载吃掉大量 token → LLM 在 500 行里找关键信息准确率暴跌 → 你还在为无用的记忆付 API 费用
做了记忆管理:
200 行上限 → 自动淘汰过期内容 → 语义搜索兜底冷记忆 → token 消耗稳定可控 → AI 定位关键信息的准确率回来了
实测下来,token 消耗降了 60% 左右,而回答质量反而提升了。因为噪音少了,信号就清晰了。

AI 的记忆管理其实和人类很像——我们也不会记住每一天吃了什么、说了什么,而是保留重要的决策、深刻的教训、核心的偏好,其余的自然淡忘。
区别是,AI 可以把"淡忘"的东西放进可搜索的归档,需要时精确召回。而人类只能靠运气——希望那个记忆碰巧还在某个神经突触里。
从这个角度看,AI 的记忆管理不是在模仿人类,而是在做人类想做但做不到的事:有选择地遗忘,同时保证遗忘的东西不会真正丢失。
Loading...

© xiyu 2022-2026