FINTECH FRONTIER DAILY

前沿科技日报 · 2026-05-22

AI 算力成本成为业界焦点开始价格博弈，微软放弃 Claude Code 转推自家开发工具，黄仁勋提出未来需要 4 万亿美元基建投入

资料提供：前沿科技研究部

降低FOMO的每日信息交付

2026-05-22 前沿科技洞见 · 日报

📊 今日关键数据

400 tokens/秒：智谱 GLM-5.1 高速版 API 的推理输出速度，刷新全球大模型 API 速度上限。来源：AI产品黄叔-公众号
4 万亿美元：黄仁勋预测的全球 AI 基础设施年度开支，是华尔街共识（1 万亿美元）的 4 倍。来源：智东西
450 亿美元：Anthropic 与 SpaceX 签署的三年算力采购协议总金额，每月支付 12.5 亿美元。来源：Z Potentials-公众号
109 亿美元：Anthropic 2026 年 Q2 预计营收，首次实现 5.59 亿美元营业利润。来源：[新智元-公众号]
700 亿元：DeepSeek 最新一轮融资总额（约 100 亿美元），估值 450 亿美元。来源：[量子位-公众号]
200 小时：Figure F.03 人形机器人在包裹分拣中的连续无故障工作时长，处理近 25 万个包裹。来源：财联社AI daily-公众号

🔍 今日值得深读

GPT-5.5 背后的训练秘密：SFT 会诱导模型产生幻觉

OpenAI 后训练联合负责人 Yann Dubois 在接受访谈时披露了 GPT-5.5 的关键训练细节。他指出，监督微调（SFT）会迫使模型在没有证据时仍然给出答案，从而诱导幻觉，而强化学习能有效抑制这一问题。此外，GPT-5.5 运行速度相比前代翻倍，但推理成本反而更低——模型越大，生成相同质量的文本反而越省 Token。

关键事实：OpenAI 后训练联合负责人首次公开确认，SFT 会系统性地诱导模型产生幻觉，RL 是目前最有效的解决方案；GPT-5.5 运行速度翻倍，模型越大越省 Token。
为什么值得深读：这揭示了当前主流模型训练范式的根本缺陷——SFT 在让模型「乐于回答」的同时，也在破坏模型的真实性。对金融科技场景中依赖模型准确性进行决策的应用有直接警示意义。
后续看点：OpenAI 是否会在 GPT-6 中进一步降低 SFT 比重；其他大模型厂商（Anthropic、DeepSeek）的后训练路线是否会跟随这一发现调整。

来源：51CTO技术栈-公众号

微软取消内部 Claude Code 授权，强制转向 Copilot CLI

微软突然要求其「体验+设备」部门的员工在 6 月底前停用 Anthropic 的 Claude Code，全面转向自家的 GitHub Copilot CLI。表面原因是 Claude Code 按 Token 计费的成本过高——用微软工程师的话说，「账本被烧爆了」。但更深层的原因是微软希望先在内部抢下市场份额，借助自家产品生态形成闭环。

这不是单一事件。Uber 也因 AI 工具烧光了 2026 年全年预算。AI 编程工具的实际使用成本远超企业预期，Token 消耗已经从一个「效率提升」的正面叙事变成了「预算黑洞」的负面问题。微软在这个时间点做出选择，也让 GitHub 和 Copilot 的战略定位变得格外清晰。

关键事实：微软强制内部员工从 Claude Code 转向 Copilot CLI，理由是 Token 成本过高；Uber 同样因 AI 工具超支烧干全年预算。
为什么值得深读：这暴露了 AI 编码工具的成本结构还远未被企业理解。Token 计价模式与企业预算体系之间存在严重错配，可能成为 AI 工具在企业侧大规模渗透的最核心障碍。
后续看点：微软 7 月后 Claude Code 禁令执行效果如何，是否会有更多企业效仿；Anthropic 是否会调整 Claude Code 的定价模型。

来源：新智元-公众号

OpenAI Codex 大更新：锁屏编程时代到来

OpenAI 发布 Codex 重大更新，三大新功能引发开发者关注。Appshots 功能让 Codex 能双击 Command 键读取全屏隐藏文本，解决了过去「AI 看不懂屏幕上显示但未暴露在无障碍接口中的信息」的问题；/goal 命令正式毕业，支持 Codex 自主编码——用户只需给出目标，Codex 会自行规划并执行；最激进的是 Mac 锁屏编程能力，实现了真正的「隔空打工」。

Sam Altman 公开推荐了这轮更新，称其为「编程体验的分水岭」。与此同时，ChatGPT 插件也正式进入 PowerPoint，进一步扩展了 AI 助手在办公场景中的覆盖。维珍航空的实践案例也表明，Codex 在工业场景中已经能够将遗留代码库重构时间从数周缩短至 30 分钟，代码量减少 78%-80%。

关键事实：Codex 新增 Appshots、/goal 自主编码、Mac 锁屏编程三大功能，ChatGPT 插件进入 PowerPoint；维珍航空用 Codex 将遗留代码重构从数周降到 30 分钟，代码量减少 78-80%。
为什么值得深读：Codex 正在从「辅助编码工具」向「自主编程 Agent」演进，锁屏编程能力打破了「人必须在电脑前」的传统工作模式。
后续看点：Windows 版 Codex 何时能获得这些功能；Appshots 读取全屏信息是否会引发企业信息安全部门的新一轮审查。

来源：新智元-公众号

DeepSeek 融资 700 亿元，启动 DeepSeek Code 项目

彭博社报道，DeepSeek 正在进行一轮约 100 亿美元融资谈判，估值达到 450 亿美元。创始人梁文峰明确强调 AGI 研究优先于短期商业化，并计划个人出资 200 亿元。与此同时，DeepSeek 正式启动 DeepSeek Code 项目，ACM 金牌得主崔添翼将挂帅 Agent Harness 团队，专注于 AI 编程工具研发。

DeepSeek 是当前中国 AI 创业公司中少数坚持「研究驱动」路线的团队之一。在 OpenAI、Anthropic 和 Google 三强争霸的格局下，DeepSeek 选择以开源和极致性价比切入。此次大额融资叠加 Code 项目启动，标志着 DeepSeek 从「模型公司」向「工具平台」的战略延伸。

关键事实：DeepSeek 融资额约 100 亿美元，估值 450 亿美元，梁文峰个人出资 200 亿元；DeepSeek Code 项目启动，崔添翼挂帅 Agent Harness 团队。
为什么值得深读：DeepSeek 是唯一同时具备研究能力、开源策略和成本优势的中国团队，其进入编程工具赛道将直接冲击 GitHub Copilot 和 Claude Code 的市场格局。
后续看点：DeepSeek Code 产品何时发布、定价策略如何；崔添翼的 Agent Harness 团队能否在产品体验上做出差异。

来源：量子位-公众号

智谱 GLM-5.1 高速版发布：400 tok/s 刷新全球最快 API

智谱推出 GLM-5.1-highspeed API，推理输出速度达到 400 tokens/秒，刷新全球大模型 API 的速度上限。不同于以往「快就是小模型」的行业惯例，GLM-5.1 高速版在保持旗舰模型能力的同时实现了速度突破，尤其是在代码生成场景中优势明显——开发者的实地测试中，20 分钟内即可完成一个完整 AI 产品的原型开发。

一位开发者用 GLM-5.1 HighSpeed 搭建了一个能自动扫描 AI 选题并推送到微信的 Agent 系统，全程仅用 20 分钟。400 tok/s 的速度已经显著改变了人机协作体验——从「等 AI 回复」变成了「AI 在喷代码」。

关键事实：GLM-5.1 高速版 API 输出速度 400 tok/s，为全球最快；开发者用它在 20 分钟内完成完整 AI 产品原型开发。
为什么值得深读：这证明「速度」正在成为大模型竞争的新维度，而非仅靠能力参数。快速响应对 Coding、Agent 实时交互等场景的体验提升是质变级别的。
后续看点：GLM-5.1 高速版的定价与竞品在同一价位段的性能对比；是否会刺激 OpenAI 和 Anthropic 跟进速度升级。

来源：AGI Hunt-公众号

🔥 今日聚合动态

大模型开源潮：Cohere、阿里、DeepSeek 三箭齐发

这一天，三家公司的开源动作形成互补：Cohere 发布了 Apache 2.0 许可的 2180 亿 MoE 模型 Command A+，阿里 Qwen3.7-Max 在 Arena 总榜中位列国产第一，DeepSeek 则正式启动 Code 项目。

视角	来源	核心信息
开源许可突破	新智元-公众号	Cohere 发布 2180 亿参数 MoE 模型 Command A+，Apache 2.0 完全开源，支持单张 B200 运行
国产模型登顶	AI异类弗兰克-公众号	阿里 Qwen3.7-Max 在 Arena 全球盲测总榜排第 5、国产第 1，多语言和 Agent 任务优势显著
编程工具突围	量子位-公众号	DeepSeek Code 项目启动，ACM 金牌崔添翼挂帅 Agent Harness 团队

关键事实：Cohere Command A+ 采用 Apache 2.0 许可证，Qwen3.7-Max 在 Arena 全球榜排第 5，DeepSeek Code 项目启动。
互补信息：Cohere 主打「完全开源许可证」，阿里主打「盲测性能」，DeepSeek 主打「编程工具链」——三者切入不同维度，共同扩大了开源阵营。
后续看点：Command A+ 在 Coding Agent 场景实测表现；Qwen3.7-Max 是否发布开源版本；DeepSeek Code 与 Copilot/Claude Code 的首轮对比评测。

具身智能新范式：从 World Action Model 到商业落地

英伟达具身智能负责人 Jim Fan 提出世界动作模型（WAM）作为 VLA 之后的下一代范式，复旦大学等机构发布首篇 WAM 综述。中国团队在商业化层面同步加速：极佳视界发布物理 AGI「双金字塔」体系并推出家庭人形机器人「拾光 S1」，Figure F.03 机器人连续 200 小时无故障处理包裹。

视角	来源	核心信息
范式定义	机器之心-公众号	英伟达 Jim Fan 正式提出 World Action Model（WAM）作为具身智能新范式
体系落地	机器之心-公众号	极佳视界发布物理 AGI 双金字塔体系并推出家庭通用人形机器人「拾光 S1」
工业验证	财联社AI daily-公众号	Figure F.03 无故障工作 200 小时，累计处理近 25 万个包裹，速度接近 30-40 件/分钟

关键事实：WAM 理论被正式提出，极佳视界发布实物产品和路线图，Figure 在包裹分拣场景实现了连续 200 小时工业级运行。
互补信息：学术（WAM）→ 产品（双金字塔/拾光 S1）→ 工业验证（Figure 200h）形成完整链条，说明具身智能正在从实验室走向可验证的工业场景。
后续看点：WAM 首篇研究论文的具体效果是否能超越 VLA；拾光 S1 的量产时间表；Figure 下一个场景是物流还是制造。

企业 Agent 工程化加速：SkillsUI、JVS Crew、SuperClaw

本周多家公司密集发布企业 Agent 工程化方案：兔展智能推出 SkillsUI，将 Agent 调度、Skill 工作流和 AIUI 卡片相结合；英特尔发布 SuperClaw 混合方案，号称可帮企业节省 7 成云端 Token；蓝凌升级「组织 AI 进化合伙人」定位。CMU 与耶鲁则从学术角度发布了 Harness 综述，提出 ETCLOVG 七层工程架构。

关键事实：SkillsUI、SuperClaw、蓝凌、CMU Harness 四套方案集中在同一天被报道，分别覆盖架构、成本、战略和理论四个企业 Agent 落地的核心维度。
互补信息：CMU/耶鲁 Harness 综述从学术角度验证了一个判断——「决定 Agent 在真实世界表现的，是 Harness 而非模型本身」。
后续看点：SkillsUI 和 SuperClaw 在金融场景的实际部署案例；Intel 混合方案能否在 Coder Agent 场景中兑现 7 成 Token 节省。

来源：CSDN-公众号 | 财联社AI daily-公众号 | 甲子光年-公众号 | AIGC开放社区-公众号

GitHub 危机与 AI 编程工具竞争格局重塑

GitHub 正经历被多家媒体称为「帝国崩塌前夜」的多事之秋：3800 个源码库泄露、高层内斗导致人才流失、Copilot 商业模式亏损引发的「按量计费」激怒了开发者。一位使用 GitHub 18 年的资深粉丝公开发文「绝交」，称 GitHub 已经不再适合严肃工作。微软内部正在加速 Copilot 对 GitHub 的收编——要求团队统一使用 Copilot CLI，CEO 职位在 Nat Friedman 离职后被取消并并入 CoreAI 团队。

与此同时，Google Search AI 化导致 DuckDuckGo 安装量暴涨 30%，用户对 AI 强推的反弹正在发酵。

关键事实：GitHub 同时遭遇安全泄露、商业模式争议和内部收编三重压力；Google Search AI 化导致 DuckDuckGo 安装量增长 30%。
互补信息：GitHub 的危机和微软内部转向 Copilot 是同一枚硬币的两面——GitHub 从「开发者第一平台」正在变成「微软 AI 生态的入口」。
后续看点：GitHub 是否会修改 Copilot 的定价方案；开发者社区是否出现大规模迁移到 GitLab 的趋势。

来源：新智元-公众号 | AI提效手册

AI 与组织变革：85% 想 Agent 化，76% 说做不到

MIT Technology Review 发布深度报告，揭示了一个令人玩味的数字：85% 的组织表示希望在未来三年内实现 Agent 化，但 76% 承认现有运营和基础设施无法支撑这种转型。这种「雄心与执行的巨大鸿沟」背后，是人、流程和工作流三个层面的准备不足。同一天，斯坦福 HAI 宣布成立 AI 与组织实验室，首次将「AI 对组织的影响」作为一门独立学科来研究。谷歌 DORA 报告则指出 AI 投资回报取决于内部平台和工程基础，并提出 J 曲线模型——AI 初期可能导致生产力下降，但扎实的工程基础能让后续回报加速。

关键事实：MIT 数据、斯坦福学术建制、谷歌 DORA 工程洞察——三件事从数据、理论和实践三个角度验证了同一个主题。
互补信息：谷歌 DORA 的 J 曲线模型给出了乐观解释，MIT 的报告则给出警醒——如果没有组织层面的变革，技术投入可能打水漂。
后续看点：斯坦福 AI 与组织实验室的首批研究成果；今年下半年企业 Agent 落地案例中，成功与失败案例的工程基础差异。

来源：MIT 科技评论 | AI组织进化论-公众号 | AI提效手册

📰 独立报道

🤖 AGI 前沿

Cohere 发布 2180 亿参数 MoE 模型 Command A+，Apache 2.0 完全开源

由 Transformer 论文作者 Aidan Gomez 主导的 Cohere，发布了 2180 亿参数的混合专家（MoE）大模型 Command A+。该模型以 Apache 2.0 许可证完全开源，支持在单张 B200 显卡上运行，是目前参数规模最大的完全开源模型之一。Command A+ 在推理、编码和知识问答等任务上对标 OpenAI 和 Anthropic 的旗舰模型，但其开源许可意味着企业可以自由商用和二次开发。

关键事实：2180 亿参数 MoE 架构，Apache 2.0 完全开源，支持单卡 B200 运行，Transformer 论文作者 Aidan Gomez 主导。
后续看点：Command A+ 在企业私有化部署场景中的性能与闭源旗舰模型的差距。

来源：新智元-公众号

阿里 Qwen3.7-Max 登上 Arena 国产第一，编程推理领先

阿里发布 Qwen3.7-Max 模型，在 Arena 全球大模型盲测总榜中排名第五、国产第一。该模型在编程和推理任务中表现尤其突出，尤其在多语言场景和复杂 Agent 任务上的表现明显优于前代。考虑到其成本优势，被开发者称为「应该叫 Ultra 而不是 Max」。

关键事实：Arena 全球盲测总榜排名第 5，国产第 1，编程和推理能力突出，在多语言和 Agent 任务上优势显著。
后续看点：是否会发布开源版本；在 Coding Agent 场景的集成效果。

来源：AI异类弗兰克-公众号

Robinhood 上线 AI Agent 自主交易功能

Robinhood 正式推出新功能，允许用户将 Claude、Cursor 等 AI Agent 连接到独立的专用投资账户，由 AI 自主执行股票交易。用户预先充值账户余额，AI Agent 可以在预设规则范围内自主决策买卖。这是券商行业首次将 AI Agent 直接嵌入个人投资决策流程。

关键事实：Robinhood 允许用户在专用账户中让 AI Agent 自主交易，支持 Claude、Cursor 等 Agent 连接。
后续看点：美国 SEC 和 FINRA 是否出台针对 AI 自主交易的监管指引；其他券商是否会跟进。

来源：TechCrunch

OpenAI 首次自主攻克 80 年数学难题「平面单位距离问题」

OpenAI 宣布其内部 AI 模型首次自主攻克了困扰数学界近 80 年的「平面单位距离问题」。这一突破的特殊之处在于：AI 未使用专门训练的数学模型，而是通过通用推理能力找到了证明思路，且思路与人类数学家此前的主流猜想不同——它利用代数数论工具反直觉地推翻了数学界长期以来的猜想。谷歌 DeepMind 紧随其后，用 AlphaProof Nexus 框架一口气解决了 9 道埃尔德什开放问题和 44 个 OEIS 整数序列猜想。

关键事实：OpenAI 模型自主攻克 80 年未解的平面单位距离问题，未用专门数学训练；DeepMind AlphaProof Nexus 解决 9 道埃尔德什开放问题。
后续看点：OpenAI 是否会公开该模型的数学能力基准；其他领域是否也会出现类似突破。

来源：学术AI大模型-公众号

AnySearch 上线：专为 AI Agent 构建的搜索基础设施

AnySearch 项目正式上线，与传统搜索引擎完全不同——它不是给人用的搜索，而是专为 AI Agent 提供结构化数据的搜索基础设施。AnySearch 通过统一入口、智能路由和隐私保护等特性，解决 Agent 在执行任务时「获取准确上下文」这一关键痛点。如果说传统搜索引擎是「信息的黄页」，AnySearch 的目标是成为 AI Agent 的「数据总线」。

关键事实：AnySearch 专为 AI Agent 设计，提供结构化数据而非传统搜索结果页，解决 Agent 数据获取痛点。
后续看点：AnySearch 是否能成为 AI Agent 生态的「默认搜索层」；Google 和 Bing 是否会推出类似的 Agent-first 搜索接口。

来源：AIGC开放社区-公众号

ICML 2026 智能体研究转向：从「能跑通」到「理解为什么」

ICML 2026 接收的 ToA（Theory of Agents）理论揭示了一个重要转向：智能体研究正在从工程竞赛转向科学探索。ToA 理论解释了长上下文、推理模型、多模态等看似不相关的技术路线背后存在的共同主线。研究者提出，智能体研究的核心问题已从「work 不 work」变成「为什么 work」——这意味着当下的 Agent 工程实践即使效果好，如果不理解其理论原理，在边缘场景中仍可能不可靠。

关键事实：ICML 2026 接收的 ToA 理论为 Agent 行为提供了统一解释框架，强调理解「why」而非仅关注「what」。
后续看点：ToA 理论是否能在企业 Agent 部署中产出可验证的质量保证模型。

来源：机器之心-公众号

🏢 AI 战略与组织变革

Anthropic 首次实现盈利：Q2 营收 109 亿美元，利润 5.59 亿

Anthropic 预计 2026 年第二季度营收达 109 亿美元，首次实现 5.59 亿美元营业利润，提前两年达成盈利目标。在企业采购份额上已超越 OpenAI，后者同期仍处于亏损状态。为支撑 Claude 的庞大算力需求，Anthropic 与 SpaceX 签署了三年近 450 亿美元的算力采购协议，每月支付 12.5 亿美元。

关键事实：Anthropic Q2 营收 109 亿美元，首次实现营业利润 5.59 亿美元；向 SpaceX 支付 450 亿美元锁定算力。
后续看点：Anthropic 的盈利能否持续（考虑到 450 亿美元 SpaceX 合同）；SpaceX 的数据中心能否按计划交付算力。

来源：新智元-公众号

斯坦福 HAI 成立「AI 与组织实验室」

斯坦福 HAI（Human-Centered AI Institute）宣布成立 AI 与组织实验室，将 AI 对组织的影响作为一门独立学科来研究。实验室采用社会技术系统的视角，联合多学科方法，探索 AI 如何重塑职场协同、组织绩效和人机协作。其成立时机恰逢 MIT 报告揭露「85% 组织想 Agent 化但 76% 基础设施不支持」的困境。

关键事实：斯坦福 HAI 成立 AI 与组织实验室，将 AI 对组织的影响确立为独立学科。
后续看点：实验室的首批研究成果是否会产出可供企业直接参考的组织设计框架。

来源：AI组织进化论-公众号

黄仁勋承认 NVIDIA「基本放弃」中国市场给华为

NVIDIA CEO 黄仁勋在一场公开活动中承认，公司已「基本放弃」中国 AI 芯片市场，将这一市场留给华为等本土企业。同时他预测 AI 基础设施年度开支将达到 4 万亿美元，远超华尔街共识的 1 万亿美元，并透露 NVIDIA 每年在台湾供应链上的支出已从 2022-2023 年的 100-150 亿美元飙升至 1000-1500 亿美元。

关键事实：黄仁勋明确表态「基本放弃」中国 AI 芯片市场给华为；预测 AI 基建年支出达 4 万亿美元。
后续看点：华为昇腾芯片在中国市场的份额变化数据；NVIDIA 在新兴市场的布局节奏。

来源：CSDN-公众号

腾讯 AI 战略：「不着急」背后的生态逻辑

与字节、阿里的激进路线不同，腾讯在 AI 时代选择了更为克制的策略。腾讯没有急于打造「第二个微信」式的 AI 超级应用，而是将 AI 能力深度嵌入微信生态。腾讯集团副总裁司晓阐释了腾讯的 AI 观：「让人放心，把人放大」——以人作为技术的掌舵者，而非被技术定义。这一战略的核心逻辑是：微信的 13 亿月活用户本身就是最好的 AI 分发渠道。

关键事实：腾讯选择将 AI 嵌入微信生态而非另建超级应用，强调「让人放心，把人放大」的 AI 观。
后续看点：微信内 AI 功能的具体落地形态；这种「嵌入式」策略与「超级应用」策略的效率对比。

来源：人人都是产品经理-公众号

💰 金融科技前沿

ICLR 2026 | TiMi：多智能体高频交易系统

ICLR 2026 收录的 TiMi 系统提出了一种创新的多智能体高频交易方案。其核心思路是将离线大模型推理与在线轻量代码执行解耦：大模型在盘前完成策略推理和参数生成，轻量执行引擎在盘中以毫秒级延迟执行交易。这套架构解决了大模型高延迟与高频交易实时性要求之间的矛盾，同时通过多智能体投票机制缓解了参数漂移问题。

关键事实：TiMi 通过离线推理+在线执行解耦实现毫秒级高频交易，多智能体投票缓解参数漂移。
后续看点：TiMi 在实际交易环境中的回测表现；是否能适配中国 A 股市场的交易规则和延迟特性。

来源：QuantML-公众号

八部门联合打击非法跨境展业，富途老虎长桥面处罚

中国证监会联合七部门发布《整治非法跨境证券业务工作方案》，拟对老虎证券、富途控股、长桥证券等平台的非法跨境展业行为进行严厉处罚。相关平台股价应声下跌。方案强调未经许可为中国境内投资者提供境外证券交易服务属于非法金融活动，并要求平台在限期内完成存量客户清理。

关键事实：八部门联合出台方案打击非法跨境证券交易，富途、老虎、长桥面临严厉处罚。
后续看点：处罚执行的时间表和力度；存量客户的资金处理方案。

来源：中国证券报

「算法银行」崛起：富民银行净利猛增背后的治理难题

富民银行以「算法银行」定位实现净利润大幅增长，但其创始人赵卫星主导的激进科技路线也引发了治理层面的争议。富民银行将核心信贷决策流程由传统风控模型切换为 AI 算法驱动的自动化决策系统，显著降低了运营成本并提升了审批效率，但监管对「黑箱决策」的合规性担忧也在加深。

关键事实：富民银行实现净利润大幅增长，核心依赖 AI 算法驱动信贷决策，但引发监管对算法透明度的关注。
后续看点：银保监会是否出台针对「算法银行」的专项监管指引。

来源：子弹财经

算力服务乱象：Token 超售、延迟拖累 Agent 落地

随着 Token 经济快速膨胀，算力服务的乱象正在成为 Agent 落地的隐形瓶颈。大量算力服务商存在超售 Token、延迟不达标等问题，导致 Agent 在实际运行中的响应质量和稳定性远低于承诺水平。智能路由平台 AI Ping 应运而生，试图通过 Token 质量调度来解决这一结构性问题。

关键事实：算力服务商超售 Token 导致 Agent 响应质量下降，AI Ping 智能路由尝试解决 Token 调度问题。
后续看点：三大运营商的 Token 套餐是否会推动行业标准化定价。

来源：甲子光年-公众号

🔧 硬件算力与智能设备

黄仁勋预测 AI 基建年度支出将达 4 万亿美元

黄仁勋在台北的公开讲话中预测，全球 AI 基础设施年度开支将达到 4 万亿美元，远超华尔街共识的 1 万亿美元。他的逻辑是：当前全球数据中心总装机容量约 1 万亿美元，AI 化改造将带来数倍的存量替换和增量建设需求。NVIDIA 每年在台湾供应链的支出已从百亿美元级飙升至千亿美元级，并计划将台湾员工从 1000 人扩至 4000 人。黄仁勋表示，这笔投入将以电费、订阅费等形式最终由普通消费者承担。

关键事实：黄仁勋预测 AI 基建年支出达 4 万亿美元（华尔街共识 1 万亿）；NVIDIA 台湾供应链年支出从百亿美元级升至千亿美元级。
后续看点：全球数据中心电力供应能否匹配 4 万亿美元的基建节奏。

来源：新智元-公众号

英伟达首款 AI 独立 CPU「Vera」打开 2000 亿美元市场

英伟达 CFO 透露，公司首款 AI 独立 CPU 产品 Vera 已打开约 2000 亿美元的潜在市场。英伟达预计今年 CPU 业务营收可见度已达 200 亿美元，有望从 GPU 霸主转变为「GPU+CPU」双引擎。Vera 专为 AI Agent 时代的数据中心需求设计，其差异化在于与英伟达 GPU 生态的深度整合。

关键事实：英伟达首款 AI CPU Vera 打开 2000 亿美元潜在市场，今年 CPU 营收可见度达 200 亿美元。
后续看点：Vera 的实际性能与 Intel/AMD 同代 CPU 的对比。

来源：虎嗅-前沿科技-网站

🎓 学术前沿

英伟达发布首个三模式大语言模型：4 倍 Token 吞吐量

英伟达发布首个能在自回归、扩散和自推测解码三种模式间切换的大语言模型。通过简单更改注意力模式，该模型最快可提升 4 倍 Token 吞吐量。这一创新并非来自模型架构的根本改变，而是通过对同一模型的注意力机制的灵活调度实现——现有模型也有可能通过类似的训练后优化来获得吞吐量提升。

关键事实：英伟达三模式模型通过注意力模式切换实现最高 4 倍 Token 吞吐量提升。
后续看点：该技术是否能整合到 NVIDIA NIM 推理平台。

来源：机器之心-公众号

Meta ATLAS：一个 Functional Token 实现可泛化视觉推理

Meta AI 与香港中文大学联合提出 ATLAS 视觉推理范式，核心创新是用一个离散的 Functional Token 统一 Agentic 和 Latent 两种推理模式。不同于此前需要显式生成中间图像或调用外部工具的方法，ATLAS 在模型内部用一个 Token 完成视觉操作的调度和内部表示的连接，实现了更简洁高效的视觉推理。

关键事实：ATLAS 用一个 Functional Token 统一两种推理模式，避免显式中间图像生成和外部工具调用。
后续看点：ATLAS 是否能在具身智能实际控制场景中复现理论效果。

来源：机器之心-公众号

李飞飞团队发布 ESI-Bench：空间智能的「ImageNet」

李飞飞团队发布 ESI-Bench，一个将观察者变为行动者的具身空间智能评测基准。研究发现了一个被广泛忽视的问题：当前 AI 在空间智能方面存在「动作盲视」——模型能看懂场景，但无法把理解转化为正确的物理动作——以及「元认知缺陷」——模型不知道自己对某些空间推理问题的把握程度。

关键事实：李飞飞团队发现 AI 存在「动作盲视」和「元认知缺陷」两大空间智能缺陷，ESI-Bench 成为首个系统化评测基准。
后续看点：ESI-Bench 是否成为具身智能领域的标准评测基准。

来源：量子位-公众号

CVPR 2026 | HiF-VLA：以 Motion 为中心实现「边想边做」

西湖大学等机构提出的 HiF-VLA 模型，为具身智能的「边想边做」提供了新方案。HiF-VLA 通过提取低维 Motion 向量作为动态先验，将时空推理直接嵌入模型的动作决策流程中，显著提升了长程任务的执行成功率。与英伟达 Jim Fan 提出的 WAM 范式形成了理论层面的呼应——两者都在推动具身智能从「先看后动」到「边想边做」的转变。

关键事实：HiF-VLA 通过低维 Motion 向量实现「边想边做」的时空推理，提升长程任务成功率，被 CVPR 2026 接收。
后续看点：HiF-VLA 在真实机器人上的部署效果和实时性表现。

来源：机器之心-公众号

内容由AI辅助生成，请谨慎甄别。资讯分享仅供参考，相关观点不代表主观立场，不构成任何形式的投资建议。

🏠 返回首页