开源模型的"够用"边界正在扩大——2026 年中格局展望

日期:2026/04/17

核心判断

开源模型在已建立的基准测试上持续紧跟闭源前沿，但闭源模型在"难以量化的通用性"上仍保持优势——长期格局取决于经济可持续性，而非技术能力。

6 条关键判断

1. 闭源模型的能力领先幅度并未随算力差距扩大而增长，这出乎意料 2. 开源实验室在基准追踪上技术实力很强，中国开源实验室更偏重基准分数 3. 闭源模型在基准之外更鲁棒、更通用，拥有基准无法衡量的"难以量化的品质" 4. RL 主导训练时代让分发成为能力提升关键，闭源可基于用户反馈做在线 RL——这是闭源可能真正拉开差距的第一个明确技术领域 5. 开源模型将在重复性自动化任务中被越来越多采用，推动领域专用开源模型投资 6. 开源与闭源竞赛本质是经济耐力赛，中国开源实验室最早今年晚些时候面临资金困难

为什么值得关注

开源在"重复性自动化任务"扩大采用，闭源在"知识工作者直接助手"保持优势——不同场景走向不同最优解
主权实体意识到超级 AI 工具"不能只落在一家或几家公司手中"，将开源模型视为不同治理范式
新的开源模型资金结构将因此出现

可能影响

重复性自动化场景加速开源采用，推动领域专用开源模型投资
闭源在 Agent 场景可能真正拉开差距：Claude Code/Codex 的在线 RL 反馈闭环是闭源独有优势
中国开源实验室面临资金压力，3-9 个月后反映在能力轨迹上；美国 2027 年初逐步夺回开源采用率

参考文献

My bets on open models, mid-2026 - Interconnects

异动雷达

前沿科技异动雷达 2026/04/17

【安全】OpenAI 发布 GPT-5.4-Cyber 网络安全专用模型，投入 1000 万美元 API 资助，联合多家安全公司推出 Trusted Access for Cyber 计划，AI 安全从"防御 AI 风险"转向"用 AI 防御"
【学术】Hugging Face 联合 IBM Research 发布 VAKRA 基准，首次系统评估 Agent 推理链、工具调用和失败模式，揭示当前 Agent 多步推理失败率显著
【应用】哥本哈根 Spektr 获 2000 万美元 A 轮融资，专注金融合规 AI Agent，自动化合规审查、监管报告和风险监控