DeepSeek V4:开源模型首次逼近闭源天花板,三条路线同时破局

日期:2026/04/25

核心判断

DeepSeek V4 不是一次简单的模型迭代,而是在性能、架构和算力自主三条线上同时突破——开源模型首次在推理基准上"基本追平"闭源前沿,百万上下文成本暴降73%,并首次在华为昇腾芯片上完成适配,标志着中国AI从"追赶者"向"路线定义者"的转变。

发生了什么

4月24日,DeepSeek发布V4系列大模型,包含V4-Pro(1.6T总参数/49B激活)和V4-Flash(284B总参数/13B激活)两个版本,均开源并支持100万token上下文窗口。

性能层面:V4-Pro在编程、数学推理、长文本理解等基准测试中超越Qwen-3.5、GLM-5.1等开源对手,与Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等闭源模型持平。DeepSeek内部85名开发者调研中,超90%将V4-Pro列为编程任务首选。但知识类测试仍落后前沿模型约3-6个月。

架构层面:V4采用压缩注意力机制(CSA/HCA),对远距离文本压缩旧信息、只保留高相关部分,近处文本保持全量注意力。这使得百万token上下文下,V4-Pro仅用V3.2的27%算力和10%内存,V4-Flash更降至10%算力和7%内存。同时采用流形约束超连接(mHC)和Muon优化器(源自Kimi首创),大幅降低训练与推理开销。

算力自主层面:V4是DeepSeek首个针对华为昇腾芯片优化的模型,智源FlagOS已实现V4-Flash在八款国产芯片上的Day0适配。这是中国大模型首次在旗舰级产品中打通非英伟达算力路径。

定价:V4-Flash输入$0.14/百万token、输出$0.28/百万token,为当前最便宜的顶级模型之一;V4-Pro输入$1.74/百万token、输出$3.48/百万token,远低于同级别闭源模型。

为什么值得关注

1. 开源与闭源的差距正在结构性收窄。V4-Pro在推理和编程基准上已"基本追平"闭源前沿,知识类差距缩短至3-6个月。这意味着企业用开源模型构建核心产品的可行性大幅提升,尤其对成本敏感的金融科技场景。

2. 百万上下文的成本不再是障碍。CSA/HCA架构使长上下文的计算和内存开销下降一个数量级,AI编程助手可读整个代码库、研究智能体可分析长文档档案,而不必担心"遗忘"或成本失控。

3. 算力去英伟达化从口号变成产品。V4在昇腾芯片上的适配不是概念验证,而是Day0级别的生产就绪。如果后续训练也能在国产芯片上完成,将从根本上改变中国AI的算力依赖格局。

可能影响

参考文献


前沿科技异动雷达 2026/04/25