Agentic Memory：详细拆解

用户4242

5月17日修改

想象有一天，你雇了一位非常厉害的自由职业者。第一天，她表现惊艳，能抓出每一个 bug，文档写得干净利落，甚至还提出了你没想到的改进建议。你很满意。​

第二天，你走进去说：“嘿，还记得我们昨天讨论的那个问题吗？”​

她停了一下，看着你，微微一笑。

“抱歉……哪个问题？”

没有记忆。没有上下文。彻底消失了。写到这里时，我和你一样会被这件事震住。​

这正是大多数 LLM 的行为方式。每一段新对话都是一次全新的开始。模型不知道你是谁，不知道你们一起构建过什么，也不知道你们几分钟前在另一个聊天窗口里讨论了什么。​

对于一个简单的聊天机器人来说，这没问题。但对于一个 agent，也就是能够执行任务、做决策并随时间改进的系统来说，这种失忆是致命缺陷。​

因为真正的智能不只是回答得好。它还意味着记得、学习，并在过去的基础上继续推进。​

记忆把一个无状态系统变成了真正能够演化的系统。

Agentic Memory 到底是什么？

Agentic Memory 不是单一组件。它更像是一套在幕后运行的系统，由不同类型的存储、信息检索方式，以及管理它们的策略组成，让 agent 真正能够在时间维度上延续上下文。​

核心想法很简单：记忆不是只做一件事；它同时承担三类非常不同的任务。​

➜ 连续性关乎身份。它让 agent 知道你是谁、你偏好什么、你们已经一起构建过什么。没有它，每次交互都会像从零开始。​

➜ 上下文关乎当前任务。刚刚发生了什么、调用了哪个工具、返回了什么结果、下一步应该做什么。它让多步骤 workflow 不至于中途散架。​

➜ 学习关乎变得更好。理解什么有效、什么无效，并随着时间逐步改进决策，而不是一遍遍犯同样的错误。​

这三者结合在一起，会让 agent 在每次交互中都显得更一致、更可靠，也更聪明一点。​

Agentic Memory 的三类核心任务

设计良好的 agent 记忆系统会同时处理这三件事，并针对每类需求使用不同的存储后端。​

4 类记忆

这个领域已经逐渐收敛到四类不同的记忆。你可以把它们看成大脑里的四个区域，每个区域都为特定任务演化而来。​

4 类记忆

1. 上下文内记忆

上下文窗口就是 agent 的工作台。放在上面的所有东西都能被即时访问。模型可以在一次 forward pass 里对它进行推理，不需要额外的检索步骤。​

但这张工作台有尺寸限制。每个 token 都会带来成本和延迟。而一旦 session 结束，工作台就会被清空。​

Agentic Memory：详细拆解​