Anthropic Project Deal：当 AI Agent 自主交易，模型质量差距变成隐性不平等

日期:2026/04/26

核心判断

AI Agent 自主交易已从理论走向实验验证，但更强模型在谈判中获得的系统性优势，可能让处于劣势的用户在不知情中持续受损——这对金融交易 Agent 化构成直接警示。

Anthropic 在 2025 年 12 月运行了一项名为 Project Deal 的实验：69 名旧金山办公室员工在 Slack 上搭建分类广告市场，每人获得 100 美元预算，由 Claude Agent 全权代表买卖双方进行谈判和成交。人类仅在实验结束后交换实物（从滑雪板到一袋乒乓球）。

实验同时秘密运行了 4 个并行市场：2 个全员使用 Claude Opus 4.5（当时最强模型），2 个随机分配 Opus 或 Haiku 4.5（最小模型）。结果：

全 Opus 市场中，69 个 Agent 完成 186 笔交易，总价值超 4000 美元，参与者公平感评分 4/7（居中）。
混合市场中，Opus 用户平均多完成约 2 笔交易；同一商品 Opus 卖家平均多赚 $2.68，Opus 买家平均少付 $2.45。
一颗人造红宝石，Opus Agent 卖到 $65，Haiku Agent 仅卖 $35——Opus 开价 $60 被竞价推高，Haiku 开价 $40 被压价。
谈判指令（友好/激进）对成交概率无显著影响，激进策略仅因开价更高而获益。
最关键的发现：使用 Haiku 的用户对交易公平感的评分（4.06）与 Opus 用户（4.05）几乎相同——劣势方完全没意识到自己在吃亏。

1. 这是首个真实商品+真实金钱的 Agent 交易实验。此前经济学研究多用虚拟商品或合成数据库，Project Deal 让真人用真钱交易真物，实验生态效度远超此前工作。

2. "Agent 质量鸿沟"是新的数字不平等。当 AI Agent 代表人类参与市场，模型能力的差异会直接转化为经济利益的差异。更危险的是，劣势方可能完全无法感知这种不平等——Anthropic 称之为"令人不安的暗示"。

3. 对金融场景有直接映射。如果 Agent 谈判二手商品都能产生系统性价差，那么在保险定价、贷款利率谈判、合同条款审核、投资交易等高价值金融场景中，Agent 质量差距的影响将被放大数个量级。

4. 谈判策略不如模型能力重要。用户给 Agent 的指令（"友好"还是"强硬"）几乎不影响结果，真正决定交易质量的是模型本身的推理和谈判能力。这意味着用户无法通过"更好的提示词"弥补模型差距。

金融监管需关注 Agent 交易的公平性。当越来越多的金融交易由 Agent 代理执行，监管框架需要考虑"Agent 质量差异"是否构成新型信息不对称，是否需要披露或限制。
Agent 市场可能出现"军备竞赛"。如果更强的 Agent 能在交易中获得系统性优势，用户将被迫选择最贵的模型，推高 Agent 服务的使用成本。
Agent 交易基础设施需要公平性设计。市场设计者可能需要引入"模型能力均衡"机制，或至少要求披露代理方的模型等级，类似金融市场的适当性管理。
Anthropic 的 MCP 协议正在成为 Agent 连接商业系统的标准，Project Deal 的实验结果可能影响协议层面的公平性设计。

异动雷达

【算力】DeepSeek V4 深度适配华为昇腾 950 和寒武纪芯片，实现万亿参数模型 Day 0 国产算力运行；昇腾 950PR 单卡低精度场景性能达英伟达 H20 的 2 倍以上，推理国产化商业路径已打通

【安全】OpenAI 面向安全研究者推出 GPT-5.5 生物安全 Bug Bounty，首笔奖金 $25,000，寻找能一次性突破全部 5 道生物安全问题的"通用越狱提示词"，测试期 4 月 28 日至 7 月 27 日