分享
智能体运行框架中的记忆现状
输入“/”快速插入内容
智能体运行框架中的记忆现状
用户4242
用户4242
6月4日修改
原帖链接:
https://x.com/mem0ai/status/2061822612398014782
智能体运行框架,是 AI 软件真正运行的地方。Cursor、Devin、Claude Code、Codex:这些环境负责处理上下文、编排工具、协调智能体,并且越来越多地开始管理记忆。越来越多时候,真正交付软件的产品不是模型本身,而是运行框架。
记忆,是运行框架设计中最难的部分。
它应该放在哪里?一次会话结束后,哪些内容应该保留下来?这仍然是一个很大程度上未解决的问题,而且每个主要运行框架都在用不同方式解决它。
这篇文章会梳理每个运行框架已经发布了什么、各自短板在哪里,以及这些缺口说明记忆基础设施必须承担什么。
智能体记忆到底是什么
有三种不同的东西都被称为记忆,区分它们很重要,因为每一种都有不同的失败模式。
1.
工作记忆
:会话期间存在于上下文窗口里的内容。会话结束后会重置;窗口填满时哪些内容能保留下来,也就是压缩问题,属于这一层。
2.
外部记忆
:任何持久化在模型权重之外的内容,例如向量库、知识图谱、文件。它可以跨会话保留,模型权重不会改变。2026 年几乎所有生产级记忆都在这一层。
3.
参数化记忆
:通过梯度下降编码进权重里的知识,由运行框架提供的训练循环塑造。它通过应用规则来泛化,而不是检索样例。2026 年生产环境部署数量为零。
认知科学里的划分,例如语义记忆、情节记忆、程序性记忆,描述的是存储的
信息类型
;上面这三层描述的是这些信息
存放在哪里
。
论文 “Contextual Agentic Memory is a Memo, Not True Memory”(arXiv:2604.27707)形式化了这一上限:检索需要 Ω(k²) 个已存样例,才能匹配参数化记忆用 O(d) 次权重更新完成的事情。下面所有系统都在这个上限之内运行。
主要运行框架已经发布了什么 [概览]
1. @AnthropicAI:Claude Code
两条路线。
CLAUDE.md
是人类编写的配置,包括约定和指令,会在会话开始时读取。Auto-memory 是由后台提取智能体写下的 Claude 笔记,存储在
~/.claude/projects/<repo>/memory/
下,围绕一个上限为 200 行或 25KB 的
MEMORY.md
索引组织,分为四类:用户、反馈、项目、参考。
检索方式决定了它的边界:每一轮 Claude Code 都会用文件名和描述清单,单独调用一个较小模型,由这个模型选择要加载哪些文件。没有 embedding,每轮最多加载五个文件,超过上限会静默截断。被丢弃的文件不会给出警告,因为它根本没有被加载。
短板:
选择依据是文件名,而不是语义搜索,所以“名字看起来相关”的文件会胜过“内容真正相关”的文件。团队共享位于
TEAMMEM
标志之后,但底层仍然是本地、限定在仓库范围内的 Markdown,没有语义索引。