大模型通胀时代:从价格战到价值战的行业转折
日期:2026/04/24
核心判断
大模型行业正在经历从"价格战"到"通胀"的结构性转变。API 定价不再一味下探,而是随 Agent 化带来的算力消耗暴增而上涨。这不是短期波动,而是行业从"获客优先"转向"价值优先"的定价逻辑重构。对金融科技团队而言,这意味着 AI 成本模型需要从"按调用计费"重新设计为"按价值计费"。
发生了什么
信号一:钛媒体宣告"通胀时代"
钛媒体 4 月 22 日发文《告别价格战,大模型共迎通胀时代》,核心论点是"价值创造比成本控制更重要"。这不是一家之言——过去两个月,多家大模型厂商的定价行为已经验证了这一趋势:
- Kimi K2.6 API 涨价 58%:月之暗面在发布更强模型的同时上调定价,商业化信号明确。
- GitHub Copilot 转向 Token 计费:微软将于 6 月将 Copilot 从"按请求次数"转向"按 Token 消耗"计费,Business 用户 $19/月含 $30 AI 额度,超出另付。Agent 化导致算力消耗暴增,按量计费成为必然。
- Claude Code 需求过载:Anthropic 测试从 Pro 计划移除 Claude Code,原因是"不可持续的需求"。
信号二:Agent 是成本上升的核心驱动力
AI 科技评论的《Agent Token 焦虑》一文直击痛点:当 Agent 帮你整理完五年邮件,账单上的数字是"智能"的代价,还是"记忆"的负债?Agent 的工作模式与聊天截然不同:
- 多轮自主决策:一个任务可能触发数十次模型调用
- 长上下文记忆:每次调用携带完整历史,Token 消耗指数级增长
- 工具调用链:每次工具调用都是一次模型推理
这意味着 Agent 时代的单用户成本可能是聊天时代的 10-100 倍。
信号三:供给端从"抢用户"转向"控成本"
Anthropic 测试移除 Claude Code 不是产品决策,而是供给约束的信号。当模型推理能力成为稀缺资源,厂商的第一优先级从"让更多人用"转向"让高价值用户用得起"。
为什么值得关注
对金融科技的直接影响
1. AI 成本模型重构:金融机构的 AI 预算规划需要从"按调用次数"转向"按 Agent 任务复杂度"估算,成本可能比预期高 5-10 倍。 2. 供应商锁定风险:Token 计费模式下,迁移成本不仅是技术适配,更是成本结构适配。不同厂商的 Token 定义和计费方式差异巨大。 3. ROI 评估标准变化:当 AI 成本上升,"用 AI 省人力"的简单 ROI 模型不再成立,需要更精细的价值评估框架。
行业格局影响
- 小厂商出局加速:价格战时代,小厂商可以靠低价生存;通胀时代,算力成本和模型能力的双重门槛将加速淘汰。
- 开源模型价值重估:当 API 定价上涨,本地部署开源模型(如 Qwen3.6-27B、百灵 Ling-2.6-flash)的成本优势凸显。
- Agent 效率成为新竞争维度:百灵 Ling-2.6-flash 以 1/10 消耗实现 SOTA Agent 能力,Token 效率比成为新的核心指标。
可能影响
短期(1-3 个月)
- 更多厂商跟进 Token 计费或上调定价
- 企业 AI 预算重新评估,部分项目可能因成本超预期暂停
- 开源模型部署需求上升
中期(3-12 个月)
- Agent 效率优化成为技术竞争焦点(模型蒸馏、缓存策略、上下文压缩)
- 金融行业出现 AI 成本管理工具和咨询服务的细分市场
- 监管关注 AI 定价透明度和公平性
长期(1 年以上)
- 大模型定价从"算力成本+"转向"价值创造-",按业务结果计费成为可能
- AI 成本成为金融产品定价的隐性因子
- 行业分化:通用模型走向基础设施定价(如电价),垂直模型走向价值定价(如咨询费)
参考文献
- 告别价格战,大模型共迎通胀时代(钛媒体,2026-04-22)
- Anthropic tested removing Claude Code from the Pro plan(Ars Technica,2026-04-22)
- Agent Token焦虑:当每次对话都在「烧钱」,技术如何破局?(AI科技评论,2026-04-22)
- K2.6 是杨植麟的第一场路演(钛媒体,2026-04-22)
- 百灵Ling-2.6-flash 正式发布(InfoQ 中文站,2026-04-22)
异动雷达
前沿科技异动雷达 2026/04/24
- 【安全】Xinference 供应链投毒风险曝光,可窃取云凭证、API 密钥和加密钱包,AI 开源基础设施成为供应链攻击新目标,金融行业安全审计迫在眉睫
- 【端侧AI】商汤绝影发布 3B 激活参数端侧模型,在车载场景超越 GPT-5.4 和 Opus 4.6,端侧推理能力突破临界点,车载 AI 从辅助走向自主决策
- 【市场】费城半导体指数 16 连涨创 1994 年以来最长纪录,月度涨幅为 2000 年以来最大,AI 需求推动芯片股进入历史极端区间