AI Agent 记忆系统设计:三种架构哲学如何回答"记住什么、遗忘什么、谁来决定"
日期:2026/04/22
深度洞见
语言模型本身没有状态,每次调用从零开始——所有 Agent 框架都必须在模型外面搭记忆系统。三个框架对"存什么、存在哪、怎么取、怎么管"给出三种答案,取舍不是技术细节,而是对"AI Agent 应该成为什么"的根本回答。
一、OpenClaw:文件系统即记忆
核心原则:"没有写进文件的,不存在"。文件是唯一真理——人类可读、可编辑、可版本控制,代价是查询能力弱。两层结构:短期日志(追加写入)+ 长期精华(MEMORY.md,策划沉淀)。混合检索:语义搜索 + BM25 关键词搜索。最关键设计:Memory Flush——Compaction 前自动把重要信息写进磁盘,将"写进文件才算记住"从人工操作变成系统级保障。Dreaming 是实验性自动沉淀,默认关闭。
二、Claude Code:上下文工程优先
核心判断:"上下文窗口容量 ≠ 可用容量",Lost in the Middle 现象决定必须主动管理信息注入。分层注入:固定层走 Prefix Cache 只付一次费用;条件层按需加载。路径即相关性:CLAUDE.md 按目录层级加载,O(1) 路径查找替代语义检索,代价是只能做静态规则匹配。三档 Token 预警(70%/85%/90%)让 Agent 感知剩余预算并主动决策——记忆系统状态成为推理输入,不只是被动存储后端。
三、Hermes:四层分离,情景记忆是核心
核心思路:"不同访问模式的记忆,必须在不同存储介质里"。热记忆 ~800 token 始终注入——上限小是反直觉但正确的设计,强制质量控制防退化。历史归档 SQLite FTS5 按需检索。Skills 是三者最根本差异——存储的不是事实而是经验,渐进式披露可积累上百个 Skill 不撑爆上下文。Skill 在使用中自我更新:发现更好做法时自动修改文档。这是真正情景记忆:不只记住发生了什么,还知道下次怎么做更好。
四、三种哲学的本质差异与硬约束
- OpenClaw 重透明可控——代价是记忆质量依赖用户主动维护
- Claude Code 重精准调度——代价是没有情景记忆,每次任务全新开始
- Hermes 重经验积累——代价是系统更复杂,需时间积累
所有方案都面临同一硬约束:上下文窗口。 三档预警、Memory Flush、渐进式披露,本质上都在回答——当记忆远大于窗口时,什么该留下、什么该丢弃。答案决定 Agent 是泛化工具还是领域专家。
五、金融科技影响
投研 Agent 需用户建模(Hermes 范式),风控 Agent 需精准调度合规规则(Claude Code 范式),运维 Agent 需透明可审计日志(OpenClaw 范式)。金融场景可能需要三种范式混合架构。情景记忆的自主进化能力是 Agent 从"工具"走向"伙伴"的关键变量。
参考文献
- AI Agent 架构设计(一):记忆系统设计(微信公众号,2026-04)
- Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践(AWS 官方博客,2025-09)
前沿科技异动雷达 2026/04/22
- 【图像生成】OpenAI 发布 ChatGPT Images 2.0,引入"深度思考"机制——生成前联网检索+推理构图,复杂图表与科学示意图生成能力大幅提升,中文文本渲染实现质的飞跃,图像生成从"抽卡式"走向"推理式"
- 【开源模型】月之暗面发布 Kimi K2.6 开源基座模型,代码能力位列开源榜首;配套 Kimi Claw 群聊系统支持多厂商 Agent 协作,可指挥 300 个 Agent 协同工作,API 定价涨 58% 释放商业化信号
- 【训练数据】Meta 将追踪员工键鼠操作训练 AI Agent,当前 Agent 成功率仅约 50%,交互训练数据稀缺性凸显;NeoCognition 获 4000 万美元种子轮构建自主学习 Agent,交互数据正成为 AI 训练新稀缺资源