智能体运行框架中的记忆现状

用户4242

6月4日修改

原帖链接：https://x.com/mem0ai/status/2061822612398014782

common.docs_name - LarkCCM_Docs_Menu_Image

智能体运行框架，是 AI 软件真正运行的地方。Cursor、Devin、Claude Code、Codex：这些环境负责处理上下文、编排工具、协调智能体，并且越来越多地开始管理记忆。越来越多时候，真正交付软件的产品不是模型本身，而是运行框架。​

记忆，是运行框架设计中最难的部分。

它应该放在哪里？一次会话结束后，哪些内容应该保留下来？这仍然是一个很大程度上未解决的问题，而且每个主要运行框架都在用不同方式解决它。​

这篇文章会梳理每个运行框架已经发布了什么、各自短板在哪里，以及这些缺口说明记忆基础设施必须承担什么。​

智能体记忆到底是什么

有三种不同的东西都被称为记忆，区分它们很重要，因为每一种都有不同的失败模式。​

1.
工作记忆：会话期间存在于上下文窗口里的内容。会话结束后会重置；窗口填满时哪些内容能保留下来，也就是压缩问题，属于这一层。​

2.
外部记忆：任何持久化在模型权重之外的内容，例如向量库、知识图谱、文件。它可以跨会话保留，模型权重不会改变。2026 年几乎所有生产级记忆都在这一层。​

3.
参数化记忆：通过梯度下降编码进权重里的知识，由运行框架提供的训练循环塑造。它通过应用规则来泛化，而不是检索样例。2026 年生产环境部署数量为零。​

认知科学里的划分，例如语义记忆、情节记忆、程序性记忆，描述的是存储的信息类型；上面这三层描述的是这些信息存放在哪里。​

论文 “Contextual Agentic Memory is a Memo, Not True Memory”（arXiv:2604.27707）形式化了这一上限：检索需要 Ω(k²) 个已存样例，才能匹配参数化记忆用 O(d) 次权重更新完成的事情。下面所有系统都在这个上限之内运行。​

主要运行框架已经发布了什么 [概览]

1. @AnthropicAI：Claude Code

两条路线。CLAUDE.md 是人类编写的配置，包括约定和指令，会在会话开始时读取。Auto-memory 是由后台提取智能体写下的 Claude 笔记，存储在 ~/.claude/projects/<repo>/memory/ 下，围绕一个上限为 200 行或 25KB 的 MEMORY.md 索引组织，分为四类：用户、反馈、项目、参考。

检索方式决定了它的边界：每一轮 Claude Code 都会用文件名和描述清单，单独调用一个较小模型，由这个模型选择要加载哪些文件。没有 embedding，每轮最多加载五个文件，超过上限会静默截断。被丢弃的文件不会给出警告，因为它根本没有被加载。​

短板：选择依据是文件名，而不是语义搜索，所以“名字看起来相关”的文件会胜过“内容真正相关”的文件。团队共享位于 TEAMMEM 标志之后，但底层仍然是本地、限定在仓库范围内的 Markdown，没有语义索引。​

智能体运行框架中的记忆现状​

智能体运行框架中的记忆现状