DeepSeek V4:开源模型首次逼近闭源天花板,三条路线同时破局
日期:2026/04/25
核心判断
DeepSeek V4 不是一次简单的模型迭代,而是在性能、架构和算力自主三条线上同时突破——开源模型首次在推理基准上"基本追平"闭源前沿,百万上下文成本暴降73%,并首次在华为昇腾芯片上完成适配,标志着中国AI从"追赶者"向"路线定义者"的转变。
发生了什么
4月24日,DeepSeek发布V4系列大模型,包含V4-Pro(1.6T总参数/49B激活)和V4-Flash(284B总参数/13B激活)两个版本,均开源并支持100万token上下文窗口。
性能层面:V4-Pro在编程、数学推理、长文本理解等基准测试中超越Qwen-3.5、GLM-5.1等开源对手,与Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等闭源模型持平。DeepSeek内部85名开发者调研中,超90%将V4-Pro列为编程任务首选。但知识类测试仍落后前沿模型约3-6个月。
架构层面:V4采用压缩注意力机制(CSA/HCA),对远距离文本压缩旧信息、只保留高相关部分,近处文本保持全量注意力。这使得百万token上下文下,V4-Pro仅用V3.2的27%算力和10%内存,V4-Flash更降至10%算力和7%内存。同时采用流形约束超连接(mHC)和Muon优化器(源自Kimi首创),大幅降低训练与推理开销。
算力自主层面:V4是DeepSeek首个针对华为昇腾芯片优化的模型,智源FlagOS已实现V4-Flash在八款国产芯片上的Day0适配。这是中国大模型首次在旗舰级产品中打通非英伟达算力路径。
定价:V4-Flash输入$0.14/百万token、输出$0.28/百万token,为当前最便宜的顶级模型之一;V4-Pro输入$1.74/百万token、输出$3.48/百万token,远低于同级别闭源模型。
为什么值得关注
1. 开源与闭源的差距正在结构性收窄。V4-Pro在推理和编程基准上已"基本追平"闭源前沿,知识类差距缩短至3-6个月。这意味着企业用开源模型构建核心产品的可行性大幅提升,尤其对成本敏感的金融科技场景。
2. 百万上下文的成本不再是障碍。CSA/HCA架构使长上下文的计算和内存开销下降一个数量级,AI编程助手可读整个代码库、研究智能体可分析长文档档案,而不必担心"遗忘"或成本失控。
3. 算力去英伟达化从口号变成产品。V4在昇腾芯片上的适配不是概念验证,而是Day0级别的生产就绪。如果后续训练也能在国产芯片上完成,将从根本上改变中国AI的算力依赖格局。
可能影响
- 金融科技团队可基于V4-Flash以极低成本构建长上下文应用(合规文档分析、投研报告生成、风控规则推理),V4-Pro则适合复杂Agent任务。
- 开源模型逼近闭源前沿,将加速闭源厂商的降价压力和差异化竞争,推理成本曲线可能进一步陡降。
- 昇腾适配成功可能推动更多中国AI公司跟进国产芯片路线,但训练环节的全面替代仍需时间验证。
- V4目前仅支持文本模态,缺少多模态能力,在需要图像/音频理解的场景中仍有短板。
参考文献
- Three reasons why DeepSeek's new model matters(MIT 科技评论,2026-04-24)
- DeepSeek previews new AI model that 'closes the gap' with frontier models(TechCrunch,2026-04-24)
前沿科技异动雷达 2026/04/25
- 【算力格局】Meta签约采购数百万颗AWS Graviton CPU用于AI Agent推理负载,标志着AI芯片需求从GPU训练向CPU推理的结构性转移。Graviton为ARM架构CPU,专为Agent实时推理、代码生成和多步协调设计,与英伟达Vera CPU直接竞争。Anthropic此前已锁定AWS Trainium GPU算力,Meta此番锁定CPU算力,云厂商自研芯片正从"补充"变为"主力"。
- 【企业AI】谷歌宣布75%新增代码由AI生成并经工程师审核,2026年资本支出飙至1750-1850亿美元,全面转向智能体工作流。Gemini Enterprise Agent Platform发布,提供200+模型选择。花旗推出AI财富管理助手"Citi Sky",Thinking Machines Lab签署数十亿美元谷歌云协议。AI代码生成比例从2024年10月的25%到如今的75%,仅一年半增长三倍。
- 【模型可靠性】Anthropic承认Claude Code存在三个Bug导致"降智"体验,声明"模型能力未变,但体验确实崩了"。社区工具CC-Canary已开源用于检测Claude Code回归问题,Hacker News上"I cancelled Claude"帖子引发广泛共鸣。同日GPT-5.5发布登顶多项基准,Claude在竞品压力下暴露工程可靠性短板。