如何让 AI Agent 的记忆更像人类？

你是否想过：为什么和 AI 聊天时间久了，它还是会重复犯错？

为什么它记不住你告诉它的事情，每次都需要重新提醒？

目前的 AI "记忆"系统真的在"记忆"吗，还是只是在机械地存储数据？

今天我想分享一篇文章，带你深入思考 AI 记忆的本质，探讨如何构建真正类似人类记忆的智能体系统。以下内容翻译自《Towards Human like Memory for AI Agents》。

记忆已经成为 AI 社区最受关注的话题之一。每隔几周，我们就会看到新的论文、框架和文章，每个都声称"解决"了 LLM 的记忆问题。然而，大多数只是美化过的缓存——存储的是令牌，而非思想。今天的记忆系统依赖于蛮力检索：把所有东西倒进向量数据库，或者用 BM25 进行排序融合。这些方法扩展的是混乱，而非认知。

如果我们想要真正理解用户并与用户共同进化的智能体，我们需要更深层的东西：元认知。在这篇博客中，我将分享我认为智能体的记忆层将如何演变得更像人类。

为什么当前的记忆系统会失败？

如今大多数 AI 应用中的记忆系统都建立在一个简单的想法上：存储每条消息、事件或摘要，需要时检索。听起来很合理，直到你扩展它。很快，这些向量存储就会充满冗余、低价值的嵌入，每个都在争夺相关性。结果是上下文膨胀、响应不连贯和检索延迟上升。

大多数人把"记忆"等同于"检索"。但检索只是谜题的一部分。无论是 BM25、RRF 还是混合搜索，管道仍然是反应性的。它找到数据；它不理解或组织数据。

即使系统声称"长期个性化"，它们真正做的只是重新获取旧事实。没有记忆巩固或精炼的机制。随着时间的推移，智能体变成了早期数据的陈旧镜像，而不是用户的自适应表示。

真正的智能取决于我们选择忘记什么。没有选择性遗忘，检索变得更慢，相关性漂移，个性化崩溃。系统最终记住了除重要内容之外的一切。

人脑实际上如何管理记忆？

我们遇到的每一条信息都会经过一个编码→存储→巩固→检索→遗忘的管道。

核心记忆

在我们思考、感知或推理之前，我们就带着一种自我感，一种我们是谁的稳定、持久的表示。这个核心记忆定义了我们的个性、偏好和偏见。对人类来说，这包括核心信念（"我是乐观的"）、个性特征（"我是情绪化的，而不是分析性的"）和稳定事实（"我住在班加罗尔"）。这就是让我们的记忆连贯的原因。

智能体应该为每个用户拥有自己的核心记忆——一个用户身份和行为倾向的结构化、演进的表示。

感觉记忆

每一个思想都始于来自我们感官的信号。感觉记忆是短暂的，只持续几秒钟，但起着过滤器的作用。

智能体需要一个感觉层，从所有模态捕获和过滤信号：消息、文件、事件、图像、音频等，在摄入之前决定什么值得注意。

短期记忆

一旦信息被过滤，它就进入短期记忆。在这里，我们实时推理、比较和组合思想。

一种受人类启发的方法将主动管理跨推理会话的焦点、相关性和主题连续性。

长期记忆

被证明有意义或反复加强的信息被编码到长期记忆中。

它被分类为：

语义记忆： 事实、概念和关系
情节记忆： 个人经历和事件

与向量转储不同，这些记忆形成随时间增长的概念图。

巩固和遗忘

在夜间，人脑重放、重新组织和压缩一天的经历。这种巩固决定永久存储什么，丢弃什么。同时，遗忘修剪未使用的路径，释放认知空间。

智能体可以运行周期性的记忆巩固周期，决定什么成为核心记忆的一部分，什么移动到长期记忆，什么被删除。

智能体记忆架构

如果我们把智能体想象成大脑，它的记忆不应该只是存储信息，它应该理解、重新组织并与用户共同进化。我设想的架构遵循人类思维如何随着时间的推移处理经验，从短暂印象到稳定知识，由身份引导。

它由五个相互连接的层组成：感觉记忆、短期记忆、长期记忆、记忆管理器和核心记忆。

感觉记忆

每次交互都从这里开始，即感觉层。它负责捕获原始输入并决定什么值得注意。

使用轻量级相关性启发式或 LLM 评分过滤噪声
从消息中提取实体、主题和关系
将显著内容传递给短期记忆进行临时存储

这一步防止向量数据库过载，并确保只有有意义的认知单元进入记忆。

短期记忆

一旦感觉数据被过滤，它就存在于短期记忆中——一个存储活动主题、推理痕迹和瞬态上下文的缓冲区。

在短暂的交互跨度内维持连续性
在共享主题下对相关消息进行分组
如果一个主题在多次交互中持续存在，它就会被提升到长期记忆。

长期记忆

当一个主题稳定时，它被转移到长期记忆。在这里，信息变得可索引、语义化，并可跨会话检索。

存储用户世界的巩固知识
按实体、主题和关系组织信息
实现行为重用和个性化

记忆管理器

这是智能体的睡眠周期——一个保持记忆平衡的周期性后台进程。

定期审查短期和长期记忆
将重要主题提升到核心记忆或降级过时主题
归档或删除无关记忆以防止混乱
生成反思和元摘要以改进推理

核心记忆

基础是核心记忆，定义用户是谁的最持久层。它为每次检索和推理周期提供一致的视角。

存储稳定事实、个性特征和行为倾向
随着新的长期模式的出现而缓慢演进
塑造所有其他记忆的解释和检索方式

整合在一起

输入进入感觉层，被过滤和标记
短期记忆临时保存主题
如果相关性持续，长期记忆会永久编码它
记忆管理器定期精炼、压缩和修剪记忆
核心记忆锚定一切，塑造智能体感知、回忆和适应的方式

结论

智能体记忆的演变不在于存储更多。而在于更好地思考。一旦智能体能够反思自己的记忆，决定什么有帮助，什么没有帮助，以及学习什么，记忆就不再是被动存储，而成为推理的主动部分。

这就是智能开始的地方：不在检索中，而在反思中。

如何让 AI Agent 的记忆更像人类？

为什么当前的记忆系统会失败？

人脑实际上如何管理记忆？

核心记忆

感觉记忆

短期记忆

长期记忆

巩固和遗忘

智能体记忆架构

感觉记忆

短期记忆

长期记忆

记忆管理器

核心记忆

整合在一起

结论

独立产品

分类

标签