
在构建持久化、上下文丰富的AI系统时,记忆已不仅是功能特性,而是核心竞争力。为什么记忆如此关键?
最初业界认为可以用巨大的上下文窗口填满所有信息,但现实击碎了这种幻想:
研究者将这种现象称为“上下文腐烂”(Context Rot)。简单地扩大上下文窗口反而导致性能下降,必须通过记忆系统来管理什么该进入上下文窗口。
一个只能“回答当前问题”的AI,与另一个能“基于历史经验做决策”的AI,这就是有无记忆能力的本质区别:
当Agent回忆起过去的对话时,它感觉更个人化、更协作。情感连续性建立信任,改变人类对AI的感受。
人类大脑进化出了分层记忆系统,因为将一切保留在工作记忆中是不可能的。AI同样需要分层记忆架构。
维度 | 短期记忆(工作记忆) | 长期记忆 |
|---|---|---|
类比 | 计算机RAM | 硬盘存储 |
作用范围 | 单次会话/任务内 | 跨会话、跨任务 |
存储内容 | 当前对话历史、即时上下文、最近交互 | 用户偏好、事实知识、历史经验、反思总结 |
存在形式 | 上下文窗口、消息列表、运行时缓存 | 外部数据库、向量存储、知识图谱 |
生命周期 | 会话结束即清除(除非主动保存) | 持久化存储,可跨周/月/年 |
管理方式 | 压缩、裁剪、折叠 | 检索、更新、演化 |
短期记忆存在于会话范围内,即单个会话或任务中,会话结束后即重置或清除,除非明确保存在其他地方。ChatGPT中提供的“临时聊天”就是会话范围内短期记忆的典型例子。
长期记忆通过从外部源(如文件或向量数据库)存储和获取来配置。与短期聊天历史不同,长期记忆并非自动包含在每个提示中。相反,基于特定场景,Agent必须在调用相关工具时回忆或检索该信息。
现代AI Agent的记忆系统通常包含多种记忆类型,每种承担不同功能:
记忆类型 | 功能描述 | 示例 |
|---|---|---|
情景记忆 | 记录具体交互或环境事件的序列和结果,用于复盘和经验学习 | 记录用户上次讨论的项目细节、记录操作步骤 |
语义记忆 | 存储概念性、事实性知识,如领域知识库和规则 | 用户偏好、专业知识、操作指南 |
工具记忆 | 总结工具使用方式与效果,用于改进后续工具选择 | 某API的调用方式、常用命令格式 |
元记忆 | 对自身记忆状态的认知和管理能力,即“关于记忆的记忆” | 记录过去的错误决策,形成反思日志 |
在实践中,通常存储以下内容:
-- 示例:SQLite记忆存储表结构
CREATE TABLE IF NOT EXISTS memory_events (
id INTEGER PRIMARY KEY AUTOINCREMENT,
agent_name TEXT,
timestamp DATETIME DEFAULT CURRENT_TIMESTAMP,
input TEXT, -- 用户输入
output TEXT, -- Agent输出
summary TEXT, -- LLM生成的摘要
embedding BLOB -- 向量嵌入
);
CREATE TABLE IF NOT EXISTS goals (
id INTEGER PRIMARY KEY AUTOINCREMENT,
agent_name TEXT,
goal TEXT, -- 长期目标
status TEXT DEFAULT 'in_progress', -- 目标状态
last_updated DATETIME DEFAULT CURRENT_TIMESTAMP
);早期系统依赖预定义的指令和工具进行记忆更新,但语言模型往往缺乏决定存储哪些信息、如何结构化组织以及何时更新的能力。
最新的研究(如Mem-α框架)采用强化学习让模型在交互中自主学习最优记忆管理策略:
奖励函数设计:
经过训练后,模型能够正确地在核心记忆、情景记忆和语义记忆中存储相应信息,实现全面的记忆管理。
更新时机 | 操作 | 示例 |
|---|---|---|
每次交互后 | 记录原始交互+生成摘要 |
|
定期(如每N次交互) | 触发反思,提炼元记忆 | 总结近期模式、错误和改进点 |
任务完成时 | 全局回顾,提炼战略记忆 | 将执行经验升华为更高层次策略 |
跨会话启动时 | 检索相关记忆,恢复上下文 | 查询向量数据库,获取用户偏好 |
# 向量检索示例
def recall_related_memories(query, top_k=3):
query_embedding = embedding_model.embed(query)
results = vector_index.query(vector=query_embedding, top_k=top_k)
return [r['metadata']['summary'] for r in results]指标 | 向量检索 | 压缩摘要 | 知识图谱 |
|---|---|---|---|
检索速度 | ⚡快 | 中 | 🐢慢 |
语义理解 | 强 | 中 | 强 |
关系推理 | 弱 | 弱 | 强 |
实现复杂度 | 低 | 中 | 高 |
存储成本 | 中 | 低 | 高 |
在实际工程中,常采用混合策略:结合向量相似度检索和结构化查询,前者通过嵌入匹配找到语义相近的记忆片段,后者可针对知识图谱执行精确匹配,有效降低漏检风险。
随着交互历史增长,资源需求和延迟会增加,必须进行记忆压缩。以下是三种主流压缩技术:
当检测到工具响应超过阈值(如20,000 token)时,将响应卸载到文件系统,替换为文件路径引用和前几行预览。Agent可在需要时重新读取或搜索内容。
文件写入和编辑操作会在对话历史中留下包含完整文件内容的工具调用。由于这些内容已持久化到文件系统,当会话上下文超过模型窗口的85%时,系统会截断旧工具调用,替换为指向磁盘文件的指针。
当卸载不再能腾出足够空间时,回退到摘要压缩:
这种双重方法确保Agent保持对其目标和进度的感知(通过摘要),同时保留在需要时恢复具体细节的能力(通过文件系统搜索)。
最新的研究引入基于艾宾浩斯遗忘曲线的记忆优化机制——一种描述人类记忆如何随时间呈指数衰减的心理模型。通过模拟这种自然衰减模式,框架动态优先保留高价值信息,同时修剪琐碎数据,模拟人类记忆巩固过程。
采用先进的记忆管理机制后:
┌─────────────────────────────────────────────────────────┐
│ Letta Platform │
├─────────────────────────────────────────────────────────┤
│ Memory Management Layer │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Core Memory │ │ Archival │ │ Summary │ │
│ │ (Working) │ │ Memory │ │ Memory │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
└─────────────────────────────────────────────────────────┘
数据流:User Input → Core Memory → LLM → Response → Summary Memory → (定期) Archival MemoryMUSE以“Plan–Execute–Reflect–Memorize”循环运行:
引入记忆系统也带来了新的治理挑战:
为AI Agent配置记忆力,本质上是构建一个模拟人脑的分层管理系统:
记忆层 | 功能 | 管理策略 |
|---|---|---|
短期记忆 | 保持当前对话连续性 | 压缩、裁剪、折叠 |
长期记忆 | 存储跨会话知识和经验 | 检索、更新、演化 |
元记忆 | 自我反思与改进 | 定期总结、提炼模式 |
真正的Agent Memory是一种系统工程,而非单一模块。它牵涉信息表达、结构化组织、检索策略、工具调用链管理、行为一致性维护以及跨会话的经验演化。与其把记忆当成“能力增强器”,不如把它放回到具体任务和交互流程中去理解——它解决的是连续性和效率问题,而不是智能本身。
1 构建有记忆的 AI Agent:SQLite 存储 + 向量检索完整方案示例,阿里云开发者社区,2025-10
2 2026 AI Agent 记忆系统三大主流范式:从检索到记忆的本质,OceanBase,2026-02
3 Agent Memory(下):工作记忆折叠、会话档案化与记忆演化,智源社区,2026-01
4 MAGMA: A Multi-Graph based Agentic Memory Architecture for AI Agents,arXiv:2601.03236,2026-01
5 A Roadmap For Responsible Approaches to AI Memory,Center for Democracy and Technology,2025-12
6 为AI智能体(Agent)增加「记忆」能力有哪些好用的工具和方案?,知乎,2025-08
7 使用 Elasticsearch 管理智能体记忆,Elastic,2026-01
8 深入解析AI智能体记忆机制:八大策略与实现方案,华为云社区,2025-08
9 Anthropic突破智能体长时记忆瓶颈,双代理架构实现跨会话连续工作,国家科技图书文献中心,2025-11
10 设计代理人工智能:架构、自主性和责任感,Ranktracker,2025-12
您好,我是肥晨。
欢迎关注我获取前端学习资源,日常分享技术变革,生存法则;行业内幕,洞察先机。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。