DeepSeek V4：开源模型首次逼近闭源天花板，三条路线同时破局

日期:2026/04/25

核心判断

DeepSeek V4 不是一次简单的模型迭代，而是在性能、架构和算力自主三条线上同时突破——开源模型首次在推理基准上"基本追平"闭源前沿，百万上下文成本暴降73%，并首次在华为昇腾芯片上完成适配，标志着中国AI从"追赶者"向"路线定义者"的转变。

发生了什么

4月24日，DeepSeek发布V4系列大模型，包含V4-Pro（1.6T总参数/49B激活）和V4-Flash（284B总参数/13B激活）两个版本，均开源并支持100万token上下文窗口。

性能层面：V4-Pro在编程、数学推理、长文本理解等基准测试中超越Qwen-3.5、GLM-5.1等开源对手，与Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等闭源模型持平。DeepSeek内部85名开发者调研中，超90%将V4-Pro列为编程任务首选。但知识类测试仍落后前沿模型约3-6个月。

架构层面：V4采用压缩注意力机制（CSA/HCA），对远距离文本压缩旧信息、只保留高相关部分，近处文本保持全量注意力。这使得百万token上下文下，V4-Pro仅用V3.2的27%算力和10%内存，V4-Flash更降至10%算力和7%内存。同时采用流形约束超连接（mHC）和Muon优化器（源自Kimi首创），大幅降低训练与推理开销。

算力自主层面：V4是DeepSeek首个针对华为昇腾芯片优化的模型，智源FlagOS已实现V4-Flash在八款国产芯片上的Day0适配。这是中国大模型首次在旗舰级产品中打通非英伟达算力路径。

定价：V4-Flash输入$0.14/百万token、输出$0.28/百万token，为当前最便宜的顶级模型之一；V4-Pro输入$1.74/百万token、输出$3.48/百万token，远低于同级别闭源模型。

为什么值得关注

1. 开源与闭源的差距正在结构性收窄。V4-Pro在推理和编程基准上已"基本追平"闭源前沿，知识类差距缩短至3-6个月。这意味着企业用开源模型构建核心产品的可行性大幅提升，尤其对成本敏感的金融科技场景。

2. 百万上下文的成本不再是障碍。CSA/HCA架构使长上下文的计算和内存开销下降一个数量级，AI编程助手可读整个代码库、研究智能体可分析长文档档案，而不必担心"遗忘"或成本失控。

3. 算力去英伟达化从口号变成产品。V4在昇腾芯片上的适配不是概念验证，而是Day0级别的生产就绪。如果后续训练也能在国产芯片上完成，将从根本上改变中国AI的算力依赖格局。

可能影响

金融科技团队可基于V4-Flash以极低成本构建长上下文应用（合规文档分析、投研报告生成、风控规则推理），V4-Pro则适合复杂Agent任务。
开源模型逼近闭源前沿，将加速闭源厂商的降价压力和差异化竞争，推理成本曲线可能进一步陡降。
昇腾适配成功可能推动更多中国AI公司跟进国产芯片路线，但训练环节的全面替代仍需时间验证。
V4目前仅支持文本模态，缺少多模态能力，在需要图像/音频理解的场景中仍有短板。

参考文献

Three reasons why DeepSeek's new model matters（MIT 科技评论，2026-04-24）
DeepSeek previews new AI model that 'closes the gap' with frontier models（TechCrunch，2026-04-24）

异动雷达

前沿科技异动雷达 2026/04/25

【算力格局】Meta签约采购数百万颗AWS Graviton CPU用于AI Agent推理负载，标志着AI芯片需求从GPU训练向CPU推理的结构性转移。Graviton为ARM架构CPU，专为Agent实时推理、代码生成和多步协调设计，与英伟达Vera CPU直接竞争。Anthropic此前已锁定AWS Trainium GPU算力，Meta此番锁定CPU算力，云厂商自研芯片正从"补充"变为"主力"。

【企业AI】谷歌宣布75%新增代码由AI生成并经工程师审核，2026年资本支出飙至1750-1850亿美元，全面转向智能体工作流。Gemini Enterprise Agent Platform发布，提供200+模型选择。花旗推出AI财富管理助手"Citi Sky"，Thinking Machines Lab签署数十亿美元谷歌云协议。AI代码生成比例从2024年10月的25%到如今的75%，仅一年半增长三倍。

【模型可靠性】Anthropic承认Claude Code存在三个Bug导致"降智"体验，声明"模型能力未变，但体验确实崩了"。社区工具CC-Canary已开源用于检测Claude Code回归问题，Hacker News上"I cancelled Claude"帖子引发广泛共鸣。同日GPT-5.5发布登顶多项基准，Claude在竞品压力下暴露工程可靠性短板。