你是否想过:为什么和 AI 聊天时间久了,它还是会重复犯错?

为什么它记不住你告诉它的事情,每次都需要重新提醒?

目前的 AI "记忆"系统真的在"记忆"吗,还是只是在机械地存储数据?

今天我想分享一篇文章,带你深入思考 AI 记忆的本质,探讨如何构建真正类似人类记忆的智能体系统。以下内容翻译自《Towards Human like Memory for AI Agents》


记忆已经成为 AI 社区最受关注的话题之一。每隔几周,我们就会看到新的论文、框架和文章,每个都声称"解决"了 LLM 的记忆问题。然而,大多数只是美化过的缓存——存储的是令牌,而非思想。今天的记忆系统依赖于蛮力检索:把所有东西倒进向量数据库,或者用 BM25 进行排序融合。这些方法扩展的是混乱,而非认知。

如果我们想要真正理解用户并与用户共同进化的智能体,我们需要更深层的东西:元认知。在这篇博客中,我将分享我认为智能体的记忆层将如何演变得更像人类。

为什么当前的记忆系统会失败?

如今大多数 AI 应用中的记忆系统都建立在一个简单的想法上:存储每条消息、事件或摘要,需要时检索。听起来很合理,直到你扩展它。很快,这些向量存储就会充满冗余、低价值的嵌入,每个都在争夺相关性。结果是上下文膨胀、响应不连贯和检索延迟上升。

大多数人把"记忆"等同于"检索"。但检索只是谜题的一部分。无论是 BM25、RRF 还是混合搜索,管道仍然是反应性的。它找到数据;它不理解或组织数据。

即使系统声称"长期个性化",它们真正做的只是重新获取旧事实。没有记忆巩固或精炼的机制。随着时间的推移,智能体变成了早期数据的陈旧镜像,而不是用户的自适应表示。

真正的智能取决于我们选择忘记什么。没有选择性遗忘,检索变得更慢,相关性漂移,个性化崩溃。系统最终记住了除重要内容之外的一切。

人脑实际上如何管理记忆?

我们遇到的每一条信息都会经过一个编码→存储→巩固→检索→遗忘的管道。

核心记忆

在我们思考、感知或推理之前,我们就带着一种自我感,一种我们是谁的稳定、持久的表示。这个核心记忆定义了我们的个性、偏好和偏见。对人类来说,这包括核心信念("我是乐观的")、个性特征("我是情绪化的,而不是分析性的")和稳定事实("我住在班加罗尔")。这就是让我们的记忆连贯的原因。

智能体应该为每个用户拥有自己的核心记忆——一个用户身份和行为倾向的结构化、演进的表示。

感觉记忆

每一个思想都始于来自我们感官的信号。感觉记忆是短暂的,只持续几秒钟,但起着过滤器的作用。

智能体需要一个感觉层,从所有模态捕获和过滤信号:消息、文件、事件、图像、音频等,在摄入之前决定什么值得注意。

短期记忆

一旦信息被过滤,它就进入短期记忆。在这里,我们实时推理、比较和组合思想。

一种受人类启发的方法将主动管理跨推理会话的焦点、相关性和主题连续性。

长期记忆

被证明有意义或反复加强的信息被编码到长期记忆中。

它被分类为:

  • 语义记忆: 事实、概念和关系

  • 情节记忆: 个人经历和事件

与向量转储不同,这些记忆形成随时间增长的概念图。

巩固和遗忘

在夜间,人脑重放、重新组织和压缩一天的经历。这种巩固决定永久存储什么,丢弃什么。同时,遗忘修剪未使用的路径,释放认知空间。

智能体可以运行周期性的记忆巩固周期,决定什么成为核心记忆的一部分,什么移动到长期记忆,什么被删除。

智能体记忆架构

如果我们把智能体想象成大脑,它的记忆不应该只是存储信息,它应该理解、重新组织并与用户共同进化。我设想的架构遵循人类思维如何随着时间的推移处理经验,从短暂印象到稳定知识,由身份引导。

它由五个相互连接的层组成:感觉记忆、短期记忆、长期记忆、记忆管理器和核心记忆。

感觉记忆

每次交互都从这里开始,即感觉层。它负责捕获原始输入并决定什么值得注意。

  • 使用轻量级相关性启发式或 LLM 评分过滤噪声

  • 从消息中提取实体、主题和关系

  • 将显著内容传递给短期记忆进行临时存储

这一步防止向量数据库过载,并确保只有有意义的认知单元进入记忆。

短期记忆

一旦感觉数据被过滤,它就存在于短期记忆中——一个存储活动主题、推理痕迹和瞬态上下文的缓冲区。

  • 在短暂的交互跨度内维持连续性

  • 在共享主题下对相关消息进行分组

  • 如果一个主题在多次交互中持续存在,它就会被提升到长期记忆。

长期记忆

当一个主题稳定时,它被转移到长期记忆。在这里,信息变得可索引、语义化,并可跨会话检索。

  • 存储用户世界的巩固知识

  • 按实体、主题和关系组织信息

  • 实现行为重用和个性化

记忆管理器

这是智能体的睡眠周期——一个保持记忆平衡的周期性后台进程。

  • 定期审查短期和长期记忆

  • 将重要主题提升到核心记忆或降级过时主题

  • 归档或删除无关记忆以防止混乱

  • 生成反思和元摘要以改进推理

核心记忆

基础是核心记忆,定义用户是谁的最持久层。它为每次检索和推理周期提供一致的视角。

  • 存储稳定事实、个性特征和行为倾向

  • 随着新的长期模式的出现而缓慢演进

  • 塑造所有其他记忆的解释和检索方式

整合在一起

  1. 输入进入感觉层,被过滤和标记

  2. 短期记忆临时保存主题

  3. 如果相关性持续,长期记忆会永久编码它

  4. 记忆管理器定期精炼、压缩和修剪记忆

  5. 核心记忆锚定一切,塑造智能体感知、回忆和适应的方式

结论

智能体记忆的演变不在于存储更多。而在于更好地思考。一旦智能体能够反思自己的记忆,决定什么有帮助,什么没有帮助,以及学习什么,记忆就不再是被动存储,而成为推理的主动部分。

这就是智能开始的地方:不在检索中,而在反思中。