AI Agent 记忆系统设计：三种架构哲学如何回答"记住什么、遗忘什么、谁来决定"

日期:2026/04/22

深度洞见

语言模型本身没有状态，每次调用从零开始——所有 Agent 框架都必须在模型外面搭记忆系统。三个框架对"存什么、存在哪、怎么取、怎么管"给出三种答案，取舍不是技术细节，而是对"AI Agent 应该成为什么"的根本回答。

一、OpenClaw：文件系统即记忆

核心原则："没有写进文件的，不存在"。文件是唯一真理——人类可读、可编辑、可版本控制，代价是查询能力弱。两层结构：短期日志（追加写入）+ 长期精华（MEMORY.md，策划沉淀）。混合检索：语义搜索 + BM25 关键词搜索。最关键设计：Memory Flush——Compaction 前自动把重要信息写进磁盘，将"写进文件才算记住"从人工操作变成系统级保障。Dreaming 是实验性自动沉淀，默认关闭。

二、Claude Code：上下文工程优先

核心判断："上下文窗口容量 ≠ 可用容量"，Lost in the Middle 现象决定必须主动管理信息注入。分层注入：固定层走 Prefix Cache 只付一次费用；条件层按需加载。路径即相关性：CLAUDE.md 按目录层级加载，O(1) 路径查找替代语义检索，代价是只能做静态规则匹配。三档 Token 预警（70%/85%/90%）让 Agent 感知剩余预算并主动决策——记忆系统状态成为推理输入，不只是被动存储后端。

三、Hermes：四层分离，情景记忆是核心

核心思路："不同访问模式的记忆，必须在不同存储介质里"。热记忆 ~800 token 始终注入——上限小是反直觉但正确的设计，强制质量控制防退化。历史归档 SQLite FTS5 按需检索。Skills 是三者最根本差异——存储的不是事实而是经验，渐进式披露可积累上百个 Skill 不撑爆上下文。Skill 在使用中自我更新：发现更好做法时自动修改文档。这是真正情景记忆：不只记住发生了什么，还知道下次怎么做更好。

四、三种哲学的本质差异与硬约束

OpenClaw 重透明可控——代价是记忆质量依赖用户主动维护
Claude Code 重精准调度——代价是没有情景记忆，每次任务全新开始
Hermes 重经验积累——代价是系统更复杂，需时间积累

所有方案都面临同一硬约束：上下文窗口。 三档预警、Memory Flush、渐进式披露，本质上都在回答——当记忆远大于窗口时，什么该留下、什么该丢弃。答案决定 Agent 是泛化工具还是领域专家。

五、金融科技影响

投研 Agent 需用户建模（Hermes 范式），风控 Agent 需精准调度合规规则（Claude Code 范式），运维 Agent 需透明可审计日志（OpenClaw 范式）。金融场景可能需要三种范式混合架构。情景记忆的自主进化能力是 Agent 从"工具"走向"伙伴"的关键变量。

参考文献

AI Agent 架构设计（一）：记忆系统设计（微信公众号，2026-04）
Agentic AI基础设施实践经验系列（三）：Agent记忆模块的最佳实践（AWS 官方博客，2025-09）

异动雷达

前沿科技异动雷达 2026/04/22

【图像生成】OpenAI 发布 ChatGPT Images 2.0，引入"深度思考"机制——生成前联网检索+推理构图，复杂图表与科学示意图生成能力大幅提升，中文文本渲染实现质的飞跃，图像生成从"抽卡式"走向"推理式"

【开源模型】月之暗面发布 Kimi K2.6 开源基座模型，代码能力位列开源榜首；配套 Kimi Claw 群聊系统支持多厂商 Agent 协作，可指挥 300 个 Agent 协同工作，API 定价涨 58% 释放商业化信号

【训练数据】Meta 将追踪员工键鼠操作训练 AI Agent，当前 Agent 成功率仅约 50%，交互训练数据稀缺性凸显；NeoCognition 获 4000 万美元种子轮构建自主学习 Agent，交互数据正成为 AI 训练新稀缺资源