AI Agent 记忆系统设计:三种架构哲学如何回答"记住什么、遗忘什么、谁来决定"

日期:2026/04/22

深度洞见

语言模型本身没有状态,每次调用从零开始——所有 Agent 框架都必须在模型外面搭记忆系统。三个框架对"存什么、存在哪、怎么取、怎么管"给出三种答案,取舍不是技术细节,而是对"AI Agent 应该成为什么"的根本回答。

一、OpenClaw:文件系统即记忆

核心原则:"没有写进文件的,不存在"。文件是唯一真理——人类可读、可编辑、可版本控制,代价是查询能力弱。两层结构:短期日志(追加写入)+ 长期精华(MEMORY.md,策划沉淀)。混合检索:语义搜索 + BM25 关键词搜索。最关键设计:Memory Flush——Compaction 前自动把重要信息写进磁盘,将"写进文件才算记住"从人工操作变成系统级保障。Dreaming 是实验性自动沉淀,默认关闭。

二、Claude Code:上下文工程优先

核心判断:"上下文窗口容量 ≠ 可用容量",Lost in the Middle 现象决定必须主动管理信息注入。分层注入:固定层走 Prefix Cache 只付一次费用;条件层按需加载。路径即相关性:CLAUDE.md 按目录层级加载,O(1) 路径查找替代语义检索,代价是只能做静态规则匹配。三档 Token 预警(70%/85%/90%)让 Agent 感知剩余预算并主动决策——记忆系统状态成为推理输入,不只是被动存储后端。

三、Hermes:四层分离,情景记忆是核心

核心思路:"不同访问模式的记忆,必须在不同存储介质里"。热记忆 ~800 token 始终注入——上限小是反直觉但正确的设计,强制质量控制防退化。历史归档 SQLite FTS5 按需检索。Skills 是三者最根本差异——存储的不是事实而是经验,渐进式披露可积累上百个 Skill 不撑爆上下文。Skill 在使用中自我更新:发现更好做法时自动修改文档。这是真正情景记忆:不只记住发生了什么,还知道下次怎么做更好。

四、三种哲学的本质差异与硬约束

所有方案都面临同一硬约束:上下文窗口。 三档预警、Memory Flush、渐进式披露,本质上都在回答——当记忆远大于窗口时,什么该留下、什么该丢弃。答案决定 Agent 是泛化工具还是领域专家。

五、金融科技影响

投研 Agent 需用户建模(Hermes 范式),风控 Agent 需精准调度合规规则(Claude Code 范式),运维 Agent 需透明可审计日志(OpenClaw 范式)。金融场景可能需要三种范式混合架构。情景记忆的自主进化能力是 Agent 从"工具"走向"伙伴"的关键变量。

参考文献


前沿科技异动雷达 2026/04/22