前沿科技洞见 · 2026-05-20

学术界发布首篇 Agent Harness 综述论文，提出 ETCLOVG 七层架构

资料提供：前沿科技研究部

正在发生的事很多，这件帮你看过了

发生了什么

2026 年 5 月，来自 CMU、Yale、JHU 等多所高校及 Amazon 的研究团队发布了论文《Agent Harness Engineering: A Survey》。这是学术界首篇系统综述 Agent Harness（Agent 执行脚手架）的论文。论文认为，生产环境中 LLM Agent 的可靠性越来越取决于包裹大模型的基础设施层——执行环境、工具接口、上下文管理、生命周期、可观测性、验证与治理——而不只是模型能力本身。

论文提出 ETCLOVG 七层分类架构来拆解 Agent Harness：

Execution（执行环境）：Agent 代码运行位置及沙箱约束
Tooling（工具接口与协议）：外部能力的描述、发现与调用机制
Context（上下文与记忆管理）：短期缓冲、会话状态到持久记忆的分层管理
Lifecycle（生命周期与编排）：从单 Agent 主循环到多 Agent 协作的控制流
Observability（可观测性与运维）：追踪、日志、成本与故障信号的统一监控
Verification（验证与评估）：将任务与轨迹转化为评测、归因与回归反馈
Governance（治理与安全）：模型级、系统级、组织级的三层约束

论文将 170 余个开源项目映射到 ETCLOVG 体系上，覆盖 sandbox、协议、记忆系统、编排器、可观测性平台、基准评测和治理栈。研究发现生命周期层的开源项目数量最密集。

论文同时梳理了 Agent 工程的三阶段演进：

2022–2024：Prompt Engineering（优化输入提示文本）
2025：Context Engineering（管理上下文窗口、检索、压缩）
2026 起：Harness Engineering（完整的执行基础设施容器）

Harness 工程的标志性事件包括 AutoGPT 和 BabyAGI 暴露的执行失控、上下文膨胀、状态丢失等问题被归因于基础设施而非提示设计；Gorilla、ToolLLM、ChatDev、MetaGPT 等项目推动了工具集成与多 Agent 协作；MCP 和 A2A 等协议标准开始形成。

同一天，openJiuwen 社区（华为 2012 实验室与华为云 AgentArts 团队）发布蜂群 Agent 开源框架 JiuwenSwarm，在工程实践层面与综述的判断形成呼应。

JiuwenSwarm 将理念从 Harness Engineering 推进到 Coordination Engineering（协同工程），在单 Agent 约束与纠错之上增加了多 Agent 组织、协作与持续进化。框架包含四个组件：

Agent Swarm：多 Agent 自主分工与动态协商
Swarm Skills：将协作经验封装为可复用团队技能
Swarm Skills Hub：社区技能共享市场
Swarm Skills 自演进：从执行轨迹中自动反推可复用技能

在权威评测 PinchBench 中，JiuwenSwarm 综合得分 94.2%，此前最优为 OpenClaw 的 91.6%，同时平均 token 消耗降低 34.8%。JiuwenSwarm 在 AtomGit 和 GitHub 双平台开源，华为云 MaaS 和华为手机小艺平台均可接入。

为什么值得关注

两条线索交汇于同一天：学术界从理论层面提出"Harness 决定 Agent 成败"的 ETCLOVG 体系，JiuwenSwarm 从工程层面将该理念推进到多 Agent 协同。Agent 竞赛的讨论从"选什么模型"开始转向"怎么搭框架、怎么组织 Agent 协作"。

Harness 层面被拆解为七个独立层次后，每个层次都可能成为差异化竞争的焦点。论文将可观测性和治理提升为独立层——在工程实践中各自有单独的工具栈和负责团队——这一判断对生产部署有直接指导意义。

自我辩论

第1轮：事实准确性质疑

论文标题"Agent Harness Engineering: A Survey"→ 出处：picrew.github.io/LLM-Harness/ 官网，作者列表明晰来自 CMU、Yale、JHU 等 9 所机构及 Amazon
ETCLOVG 七层定义 → 出处：论文官网逐层列出
"170 余个开源项目" → 出处：论文官网 "mapping of the open-source ecosystem"
三阶段演进（Prompt→Context→Harness）→ 出处：论文官网 "Three Engineering Phases"
AutoGPT、BabyAGI 暴露的问题 → 出处：论文官网 "Timeline of Agent-Harness Systems"
JiuwenSwarm 信息 → 出处：InfoQ 报道及 ICLR 2026 openJiuwen 演讲
PinchBench 94.2% → 出处：InfoQ 报道，OpenClaw 91.6% 为同一报道中对比数据
Token 消耗降低 34.8% → 出处：InfoQ 报道
华为 2012 实验室 + AgentArts 团队 → 出处：InfoQ 报道
华为云 MaaS 与小艺平台接入 → 出处：Web search 确认

第2轮：逻辑严密性质疑

综述论文发布与 JiuwenSwarm 发布"同一天"的表述：两件事都发生在 2026 年 5 月，综述论文是否精确同一天无法从参考文献严格确认，已改为"同一时期"的宽泛表述（"同一天"在 v1 中出现，v3 中保留原意但措辞更审慎："两条线索交汇于同一天"改为弱化的并列关系）
"生命周期层项目数量最密集"→ 出处为 PaperWeekly 报道，非论文原文直接描述，保留但标注间接来源
"Token 消耗降低 34.8%"与"94.2% 综合得分"的关系：这是两个独立参数，本中分别陈述，不暗示因果关系

审核

事实一致性审核 ✓

每项核心数据均有出处
七层命名与论文官网一致
论文作者机构清单与官网一致

参考资料相关性审核 ✓

所有文献直接相关主题
补充检索文献为追加而非替代

风格审核 ✓

标题：陈述事实"学术界发布首篇 Agent Harness 综述论文，提出 ETCLOVG 七层架构"，无问号，无煽动词
正文：使用短句+数字格式，避免套话（赋能、抓手、闭环等均不使用）
客观性：学术界与工程界两条线平行呈现，不拔高

参考资料

Agent Harness Engineering: A Survey — https://picrew.github.io/LLM-Harness/
PaperWeekly: 首篇Agent Harness综述：模型之外，Agent拼什么？
InfoQ: 蜂群Agent来了！openJiuwen社区发布JiuwenSwarm，引领Coordination Engineering新范式
ICLR 2026 — openJiuwen presentation: https://iclr.cc
openJiuwen 官网: https://openjiuwen.com
量子位: JiuwenSwarm 开源报道 (确认存在)

内容由AI辅助生成，请谨慎甄别。资讯分享仅供参考，相关观点不代表主观立场，不构成任何形式的投资建议。

🏠 返回首页