分享
Agentic Memory:详细拆解
输入“/”快速插入内容
Agentic Memory:详细拆解
用户4242
用户4242
5月17日修改
原帖链接:
https://x.com/techwith_ram/status/2037499938574110770
想象有一天,你雇了一位非常厉害的自由职业者。第一天,她表现惊艳,能抓出每一个 bug,文档写得干净利落,甚至还提出了你没想到的改进建议。你很满意。
第二天,你走进去说:“嘿,还记得我们昨天讨论的那个问题吗?”
她停了一下,看着你,微微一笑。
“抱歉……哪个问题?”
没有记忆。没有上下文。彻底消失了。写到这里时,我和你一样会被这件事震住。
这正是大多数 LLM 的行为方式。每一段新对话都是一次全新的开始。模型不知道你是谁,不知道你们一起构建过什么,也不知道你们几分钟前在另一个聊天窗口里讨论了什么。
对于一个简单的聊天机器人来说,这没问题。但对于一个 agent,也就是能够执行任务、做决策并随时间改进的系统来说,这种失忆是致命缺陷。
因为真正的智能不只是回答得好。它还意味着记得、学习,并在过去的基础上继续推进。
记忆把一个无状态系统变成了真正能够演化的系统。
Agentic Memory 到底是什么?
Agentic Memory 不是单一组件。它更像是一套在幕后运行的系统,由不同类型的存储、信息检索方式,以及管理它们的策略组成,让 agent 真正能够在时间维度上延续上下文。
核心想法很简单:记忆不是只做一件事;它同时承担三类非常不同的任务。
➜
连续性
关乎身份。它让 agent 知道你是谁、你偏好什么、你们已经一起构建过什么。没有它,每次交互都会像从零开始。
➜
上下文
关乎当前任务。刚刚发生了什么、调用了哪个工具、返回了什么结果、下一步应该做什么。它让多步骤 workflow 不至于中途散架。
➜
学习
关乎变得更好。理解什么有效、什么无效,并随着时间逐步改进决策,而不是一遍遍犯同样的错误。
这三者结合在一起,会让 agent 在每次交互中都显得更一致、更可靠,也更聪明一点。
Agentic Memory 的三类核心任务
设计良好的 agent 记忆系统会同时处理这三件事,并针对每类需求使用不同的存储后端。
4 类记忆
这个领域已经逐渐收敛到四类不同的记忆。你可以把它们看成大脑里的四个区域,每个区域都为特定任务演化而来。
4 类记忆
1. 上下文内记忆
上下文窗口就是 agent 的工作台。放在上面的所有东西都能被即时访问。模型可以在一次 forward pass 里对它进行推理,不需要额外的检索步骤。
但这张工作台有尺寸限制。每个 token 都会带来成本和延迟。而一旦 session 结束,工作台就会被清空。