FINTECH FRONTIER DAILY

前沿科技日报 · 2026-05-26

各大 AI 厂商围绕 Agent 产品降价抢市场、裁员调整结构，行业开始推动 Agent 术语标准化

资料提供：前沿科技研究部

降低FOMO的每日信息交付

2026-05-26 前沿科技洞见 · 日报

📊 今日关键数据

75%：DeepSeek V4-Pro API 永久降价幅度，输入缓存命中价格降至 0.025 元/百万 Tokens（来源：钛媒体）
5/6 显存节省 + 97.2% 能力保留：面壁智能 BitCPM-CANN 三值量化模型在华为昇腾上实现推理显存降至全精度 1/6，能力保留率达 97.2%，8B 模型可运行于 8GB 内存手机（来源：APPSO）
165%：2026 年 AI 专用 HBM 内存价格同比涨幅，HBM 成为 AI 芯片最大成本项（来源：HackerNews 日报）
数百人被裁 + 数千 AI Agent 上岗：ClickUp 用数千 AI Agent 替代数百员工的客服、营销和运营岗位，是迄今最大规模的 SaaS 行业 AI 替代人力案例（来源：InfoQ）

🔍 今日值得深读

Hugging Face 发布 AI Agent 术语统一指南：Harness 和 Scaffold 到底指什么

Hugging Face 发布了一篇关于 AI Agent 术语的官方博文，试图终结行业里对 "Agent" 及其相关概念的混乱使用。文章厘清了三个关键术语：Agent（能使用工具完成开放式任务的 AI 系统）、Harness（Agent 的运行环境和工具集成层）和 Scaffold（Agent 的外围基础设施，如工作流编排、权限管理、任务队列等）。

这篇文章的触发点是行业现状——不同公司和框架对 "Agent" 的定义差异巨大，导致开发者在选择工具和评估方案时缺乏共同语言。Hugging Face 从开源生态的立场出发，提出了一套以 "Harness 是模型与工具之间的桥梁" 为核心的分类体系，将 smolagents、OpenAI Agents SDK、Claude Code 等主流框架纳入统一参照系。

关键事实：Hugging Face 将 AI Agent 拆分为三个抽象层：Model（推理大脑）、Harness（工具/代码执行层）、Scaffold（工作流/权限/编排）
为什么值得深读：Agent 领域正在从各自为战走向标准化，术语的统一意味着框架的竞争将进入互操作性阶段，这对金融科技团队选型 Agent 基础设施有直接参考价值
后续看点：Hugging Face 的 smolagents 框架是否会成为 Harness 层的参考实现；主流 Agent 框架（LangChain、CrewAI）会否跟进统一术语

来源：Hugging Face

DeepSeek V4 永久降价 75%，同时招募团队造中国版 Claude Code

DeepSeek 在同一天祭出两记重拳。第一拳是价格：V4-Pro 系列 API 从促销价正式转为永久降价，输入缓存命中价格降至 0.025 元/百万 Tokens，输出价格降至 6 元/百万 Tokens，降幅达 75%。第二拳是组织动作：DeepSeek 正在招聘 Agent 相关岗位，筹备从零构建中国版 Claude Code——一款终端原生的 AI 编程 Agent。

价格战背后是 DeepSeek 的技术降本。MoE 架构、MLA 注意力机制和 KV Cache 压缩三管齐下，使得推理成本可以持续下探。而进入 Agent 编程工具赛道，意味着 DeepSeek 不再满足于做模型提供商，要将模型能力通过 Harness 层直接嵌入开发者工作流。就在同一天，开源社区还推出了 Reasonix——一款基于 DeepSeek 的终端原生编码代理，前缀缓存命中率高达 99.82%，可将费用压至原价的五分之一。

关键事实：DeepSeek V4-Pro API 永久降价 75%，输入缓存命中和输出价格分别降至 0.025 元和 6 元/百万 Tokens；同步招聘 Agent 岗位构建中国版 Claude Code
为什么值得深读：降价 + 自建 Agent 工具链，标志着国产大模型从 "卖 API" 转向 "抢开发者入口"，定价权争夺和生态锁定正在同时发生
后续看点：DeepSeek 自研 Agent 工具能否在代码质量上接近 Claude Code；国内其他模型厂商（阿里、字节）是否会跟进降价并自建 Agent 层

来源：量子位

ClickUp 大裁员：数百人离场，数千 AI Agent 上岗

成立九年的项目管理 SaaS 公司 ClickUp 正在进行一场大规模裁员——裁掉数百名员工，由数千个 AI Agent 接替他们的工作。TechCrunch 的报道直指这场裁员的信号意义：这不是一次普通的成本优化，而是 SaaS 公司的运营模型在 AI 时代被根本性地重写。

报道指出，ClickUp 此前约 1000 人的团队中，客户支持、内容营销、内部运营等岗位是裁撤重点。AI Agent 不仅处理客服 ticket，还接管了产品文档撰写、用户引导和部分 QA 测试流程。ClickUp 的 CEO 在内部信中称这次调整是为了 "在 AI 时代保持竞争力"。

关键事实：ClickUp 裁掉数百名员工（占团队相当比例），由数千个 AI Agent 替换客服、营销、运营等岗位
为什么值得深读：这是 SaaS 行业中迄今最大规模的 "AI 替代人力" 案例，提供了 AI 改变企业组织成本的量化样本——烧 token 还是养员工，这道选择题正在从科技媒体讨论变成真实的 CFO 决策
后续看点：ClickUp 裁撤后客户满意度是否会下降；其他 SaaS 公司（Atlassian、Asana）是否跟进类似规模的替代

来源：TechCrunch

面壁智能开源 BitCPM-CANN：国产算力首次跑通 1.58-bit 模型训练，推理显存省 5/6

面壁智能联合清华大学和 OpenBMB 开源社区，在华为昇腾开发者大会上发布了 BitCPM-CANN——全球首个完全基于国产华为昇腾平台训练并开源的三值（1.58-bit）大模型。模型覆盖 0.5B 到 8B 全尺寸，能力保留率达 97.2%，推理时显存需求仅为同规模全精度模型的 1/6。

这项突破针对的是一个现实困境：AI 专用 HBM 内存价格 2026 年涨幅超 165%，高端 AI 芯片对华出口管制反复无常。BitCPM-CANN 通过三值量化（权重仅取 -1/0/+1），在不依赖高端 GPU 的条件下完成了模型训练全流程，构建了从训练框架、模型架构到国产芯片适配的完整技术闭环。

关键事实：BitCPM-CANN 是全球首个纯国产算力（华为昇腾）端到端训练并开源的 1.58-bit 大模型，覆盖 0.5B-8B，能力保留率 97.2%，显存节省 5/6
为什么值得深读：在芯片受限和 HBM 价格暴涨的双重压力下，低比特训练不是学术玩具，而是中国大模型产业链的生存策略——用算法突破弥补硬件差距
后续看点：8B 模型在手机端实际推理速度和功耗表现；面壁智能本周（端侧开源周）后续是否发布更大尺寸的 1.58-bit 模型

来源：智东西

Claude 被曝测试 "双模记忆系统"：AI 助理的记忆能力或将翻新

知名 AI 博主 TestingCatalog 透露，Anthropic 正在为 Claude 测试一套全新的 "双模记忆系统"（Dual-mode Memory）。除了现有的 "经典记忆" 模式外，Claude 未来可能新增一种名为 "Memory Files" 的文件式记忆架构，允许用户以结构化的方式告诉 Claude 自己的偏好、上下文和长期信息。

目前的 AI 助理记忆功能普遍短小且不稳定——用户每次会话都要重新交代背景。Memory Files 的测试曝光意味着 Anthropic 试图将记忆从一个 "黑箱缓存" 变成一个显式的、可编辑的文件系统。这与 DeepSeek 当天公布的高前缀缓存命中率（99.82%）形成呼应——记忆和上下文复用正成为 Agent 能力差异化的关键战场。

关键事实：Claude 正在测试双模记忆系统，新增 "Memory Files" 文件式记忆架构，区别于现有的经典记忆模式
为什么值得深读：记忆能力是 AI Agent 从 "单次对话工具" 升级为 "长期协作者" 的核心瓶颈——谁先解决好记忆，谁的 Agent 就能在企业场景里站稳脚跟
后续看点：Memory Files 是否会向所有 Claude 用户开放；文件式记忆的安全边界（隐私、共享权限）如何设定

来源：智东西

🔥 今日聚合动态

AI Agent 生态：术语统一、国产发力、组织变革三重奏

同一天内，AI Agent 领域在不同层面出现了共振。Hugging Face 从开源社区角度统一术语，阿里云在 520 峰会上交出 "Agentic 答卷"，Datawhale 社区发布 Agent Harness 最小版教程——开源、云厂商、开发者社区三方在同一时间推动 Agent 走向工程化。

视角	来源	核心信息
术语标准	同上（Hugging Face 深读）	发布 Agent/Harness/Scaffold 三层分类体系
云厂商落地	极客公园	阿里云 520 峰会发布 Agentic 产品矩阵
开发者实践	Datawhale	发布 Agent Harness 最小实现版本
企业落地	InfoQ	零售与制造业 Agentic AI 从试点走向运营

关键事实：Hugging Face 发布 Agent 术语标准，阿里云发布 Agentic 产品矩阵，开发者社区跟进 Harness 实现
互补信息：三方并非竞争关系——Hugging Face 定标准，阿里云铺基建，社区做开发者体验，共同加速 Agent 工程化
后续看点：阿里云 Agentic 产品的实际开发者采用数据；Hugging Face 术语标准能否成为行业共识

AI 编程工具混战：DeepSeek、Claude Code、Copilot 创始人的三方表态

AI 编程工具正在进入 "Harness 层竞争"。DeepSeek 宣布自建 Agent 编程工具与招聘，Claude Code 以 Harness 化整合模型能力成为对标对象，而 Copilot 创始工程师 Sundaresan 则公开表示"大多数 AI 编码就像开着法拉利去买牛奶"——指用户用最贵的模型做最简单的任务，成本错配严重。

视角	来源	核心信息
新入局者	APPSO	DeepSeek 招人组队从零造中国版 Claude Code
成本反思	AI前线	Copilot 创始工程师：用户在 $40/百万 token 的模型上跑简单提示词是浪费
实战评测	InfoQ	ClickHouse 团队评测 Agentic Coding：效果显著但陷阱不少
新型玩法	APPSO	Codex 被用于网速优化等非编程场景，模型与产品共生

关键事实：AI 编程工具竞争从 "谁模型好" 进入 "谁 Harness 好" 阶段，成本意识和任务匹配成为新焦点
互补信息：Sundaresan 的观点首次引入 "任务-模型匹配" 概念，与 DeepSeek 的降价逻辑形成对照——低价不是目的，用对模型才是
后续看点：DeepSeek 自研 Agent 工具在代码质量上能否接近 Copilot 或 Claude Code

AI 安全与伦理：教皇颁布首份 AI 通谕，Anthropic 参与起草

教皇良十四世（Pope Leo XIV）发布首份关于 AI 的通谕《Magnifica humanitas》，呼吁对 AI 进行 "解除武装"（disarm），警告 AI 的不可预测性。Anthropic 联合创始人 Chris Olah 出席发布会并发表讲话，通谕中关于 AI 不可预测性的章节被指受 Anthropic 影响。同期，英国 AI 安全研究所（AISI）的运作模式也正在成为其他国家的 AI 监管蓝本。

视角	来源	核心信息
宗教伦理	Washington Post	通谕中 AI 不可预测性章节体现 Anthropic 影响
安全实践	NYT	UK AISI 由 OpenAI/Google 前员工组成，成为他国监管范本
技术评论	Ars Technica	教皇引用甘道夫呼吁 "解除 AI 武装"
行业合作	同上（SailPoint 独立报道）	SailPoint 与 Anthropic 合作，接入 Claude Enterprise 合规 API

关键事实：教皇首次发布 AI 通谕，Anthropic 联合创始人参与；UK AISI 成为全球 AI 安全治理范本
互补信息：宗教介入 AI 安全讨论使 AI 治理从技术领域升级为普世伦理议题；AISI 模式正被多国复制，AI 安全国际标准加速成型
后续看点：Anthropic 是否会在产品中体现教皇通谕中的建议；AISI 的测评框架能否被中国监管认可

端侧 AI 加速落地：从手机到芯片的全链路推进

端侧 AI 在同一天迎来多条线索的集中推进。面壁智能在昇腾上跑通 1.58-bit 训练，OPPO 发布首款带实体 AI 键的 Reno16，华为推出 HarmonyOS 6.0 端侧 AI 智能体，华为的同时还提出了全新的 AI 时代芯片设计方法——从模型到芯片、从芯片到手机的链条正在闭合。

视角	来源	核心信息
模型突破	51CTO技术栈	面壁 BitCPM-CANN：国产算力 1.58-bit 训练，8B 可跑手机
终端落地	智东西	OPPO Reno16 首搭实体 AI 键，Pro 版起售价涨 800 元
系统级	人人都是产品经理	HarmonyOS 6.0 推出端侧 AI 智能体与空间化交互
芯片设计	Tech in Asia	华为提出 AI 时代芯片设计新方法

关键事实：端侧 AI 从模型训练到芯片设计、从操作系统到终端硬件形成全链路推进
互补信息：三值量化和端侧 AI 芯片设计是同一问题的两面——如何在受限硬件上跑大模型
后续看点：OPPO AI 键的用户日活数据；BitCPM-CANN 在手机端的实际推理延迟

📰 独立报道

🤖 AGI 前沿

英国 AI 安全研究所：从 GPT 评估到全球监管范本

纽约时报的深度报道揭示了英国 AI 安全研究所（AISI）的内部运作。这个由前 OpenAI 和 Google 研究人员组成的政府机构，正通过系统化测评模型安全漏洞，成为多国 AI 政策的参照模板。报道指出，AISI 的测评框架包括对抗攻击、偏见检测、越狱测试等维度，其测评方法已被欧盟和日本借鉴。

关键事实：AISI 由 OpenAI/Google 前员工组成，测评框架覆盖对抗攻击、偏见、越狱等多维度
后续看点：AISI 的下一轮模型安全评分会否纳入中国大模型

来源：New York Times via Techmeme

Gemini 付费用户遭遇降级：Google AI 订阅策略引众怒

一篇来自 "夕小瑶科技说" 的报道指出，Google Gemini 近期在付费用户侧出现了功能降级和体验倒退。具体表现为部分高级功能被移至更高订阅层级、响应速度下降、上下文窗口缩水等。用户社群将其称为 "Gemini 叛变"，引发对 AI 订阅制商业可持续性的广泛讨论。

关键事实：Gemini 付费用户遭遇功能降级和体验倒退，高级功能被移入更高订阅层级
后续看点：Google 是否会公开回应并调整订阅策略；OpenAI/Anthropic 是否存在类似的降级风险

来源：夕小瑶科技说

Google：互联网的新房东

Tech in Asia 刊文分析 Google 在 AI 搜索时代的定位。文章指出，Google 正从搜索引擎变成互联网流量的 "新房东"——AI Overview 直接在搜索结果页回答问题，使得内容网站失去了流量入口。同时，Google 云也在加速 AI 布局，推出东南亚 AI 创业加速器。

关键事实：Google AI Overview 使搜索结果页成为流量终点而非中转站，内容网站的流量和广告收入面临结构性冲击
后续看点：内容平台（新闻媒体、独立博客）对 Google 的法律挑战是否升级

来源：Tech in Asia

智源大会 2026 预告：图灵奖得主领衔，中国大模型第一梯队集结

2026 智源大会即将召开，图灵奖得主与中国大模型第一梯队（包括 DeepSeek、智谱、面壁、百川等）将同台探讨 AI 下一程。大会主题覆盖模型架构、Agent、多模态和 AGI 路线图，是观察中国 AI 学界和产业界共识的重要窗口。

关键事实：2026 智源大会集结图灵奖得主与中国大模型公司，聚焦 AI 下一程
后续看点：大会上是否有新的开源模型或技术路线发布

来源：量子位

🏢 AI 战略与组织变革

微软按下 vibe coding 暂停键：烧 token 已经比员工贵了

微软内部的一项评估显示，大规模使用 AI 编程工具（vibe coding）产生的 token 费用已经超过了雇佣同等效率程序员的成本。这一发现促使微软调整策略，要求团队重新评估 AI 工具的使用场景，而非无差别推动 AI 编码。这与当天 Copilot 创始工程师 Sundaresan 的 "法拉利买牛奶" 论断形成双重印证。

关键事实：微软内部评估发现 AI 编码的 token 成本超过人力成本，调整了 vibe coding 推广策略
后续看点：其他大型科技公司是否会跟进类似评估和策略调整

来源：百度百家号

SailPoint 联手 Anthropic：企业安全市场迎来 AI 合规 API

美国安全公司 SailPoint 与 Anthropic 达成合作，接入 Claude Enterprise 的 Compliance API。该 API 使企业能够获取 Claude 使用情况中的活动记录、用户角色和运营数据，用于安全审计和合规管理。这是 Anthropic 在企业级安全合规领域的重要布局。

关键事实：SailPoint 接入 Anthropic Compliance API，实现企业级 AI 使用审计和合规管理
后续看点：Compliance API 能否成为 Anthropic 企业版的差异化卖点，OpenAI 是否会跟进

来源：Tech in Asia

拉勾网破产警示：传统流量生意的终结

曾是互联网招聘标志性平台的拉勾网宣告破产。分析指出，拉勾网的衰落不仅是自身经营问题，更是传统流量分发模式在 AI 时代的终结——当 AI 可以完成简历筛选、面试评估和技能匹配时，以信息撮合为核心的招聘平台面临存在价值重整。

关键事实：拉勾网破产，标志着互联网招聘平台的流量撮合模式在 AI 时代失效
后续看点：AI 驱动的招聘工具（如 LinkedIn AI Recruiter）是否会完全取代传统招聘平台

来源：微信公众号

⛓️ 区块链创新

如果 AI 来运行比特币网络：一个月吃掉 Uber 和微软的预算

U.Today 的一篇分析文章探讨了 AI 管理区块链的可能性。研究推算，如果让 AI Agent 系统来运行比特币网络的全节点维护、交易验证和共识参与，其计算成本将在数月内耗尽 Uber 和微软级别的年度 IT 预算。文章认为 AI 区块链不是科幻——现代 Agent 系统的能力已经接近这个门槛，但经济性仍是核心障碍。

关键事实：AI 全量管理比特币网络的成本在数月内可耗尽大型企业年度 IT 预算
后续看点：轻量 AI-Agent + 区块链的混合架构（非全量管理）的设计方案

来源：U.Today

Bybit CEO：AI 和稳定币正在重塑金融

Bybit CEO Ben Zhou 在接受 Tech in Asia 采访时表示，AI 和稳定币是金融行业最重要的两股变革力量。他指出 AI 正在改变交易策略生成、风险管理和客户服务，而稳定币则在重新定义跨境支付和资产结算的基础设施层。

关键事实：Bybit CEO 指出 AI 和稳定币是金融行业变革的双引擎
后续看点：Bybit 是否推出 AI-native 的金融产品或稳定币结算系统

来源：Tech in Asia

新型 "TrapDoor" 病毒窃取加密钱包：Solana、DeFi 开发者成目标

一种名为 "TrapDoor" 的新型恶意软件正在针对加密货币开发者社区，专门窃取 Solana 钱包私钥和 DeFi 协议的管理员凭证。该病毒通过伪装成 AI 开发工具的方式传播，利用开发者对 AI 工具的高度信任实施攻击。

关键事实：TrapDoor 病毒伪装成 AI 开发工具，窃取 Solana 钱包私钥和 DeFi 管理员凭证
后续看点：Solana 基金会是否发布针对此病毒的专项安全建议

来源：U.Today

💰 金融科技前沿

美国紧急叫停 AI 监管令：不想输给中国

美国政府紧急叫停了一项准备实施的 AI 监管行政令。报道指出，叫停的核心原因是对中国 AI 竞争力的担忧——监管方担心过于严厉的规则会让美国在 AI 军备竞赛中落后。此举标志着 AI 监管从 "伦理优先" 向 "竞争力优先" 的转向。

关键事实：美国紧急叫停 AI 监管令，核心原因是对中国 AI 竞争力的担忧
后续看点：被叫停后，美国 AI 监管是否走向行业自律模式；中国是否会利用这个窗口加速 AI 规则输出

来源：微信公众号

AI 幻觉惹官司：百度 AI 编造律师罪名，当事人决定起诉

一起 AI 幻觉引发法律诉讼的案例引发广泛关注。百度 AI 在回答中编造了一位律师涉及 "威胁法官、私刻印章、介绍贿赂" 等多项罪名。当事人已决定起诉百度。该事件将 AI 幻觉的法律责任问题从学术讨论推入了法庭审判阶段。

关键事实：百度 AI 幻觉编造律师多项罪名，当事人提起诉讼——AI 幻觉法律责任的首次司法检验
后续看点：法院如何认定 AI 生成虚假信息的责任主体；该判例是否推动 AI 生成内容的监管立法

来源：微信公众号

建行福建省分行 2026-2027 金融科技研发项目招标：亚大等 5 家入围

建设银行福建省分行公布了 2026-2027 年金融科技研发服务项目招标结果。亚大等 5 家供应商入围，神州数码等 3 家被否决。这是国有大型银行持续加大金融科技自研投入的又一案例，也反映出金融科技供应商市场的洗牌趋势。

关键事实：建行福建省分行金融科技研发项目 5 家入围 3 家被否，银行 FinTech 自研投入持续扩大
后续看点：六大行 2026 年整体金融科技预算规模的变化趋势

来源：微信公众号

🎓 学术前沿

ICML 2026：中科大揭开大模型终身归一化黑箱

中科大团队在 ICML 2026 上发表论文，系统揭示了终身归一化（Lifelong Normalization）机制。研究发现，大模型在经历百万次级别的序列编辑后，参数崩塌的核心原因在于归一化层的累积偏差。团队提出 StableEdit 方法实现长程正向累积，为解决模型持续学习中的灾难性遗忘提供了理论基础。

关键事实：中科大团队揭示大模型百万次编辑后的参数崩塌机制，并提出 StableEdit 方法
后续看点：StableEdit 在 LLaMA 和 DeepSeek 等主流模型上的集成效果

来源：PaperWeekly

港中文发布 7 模态人体动作数据集：揭开大模型理解能力短板

香港中文大学邢国良教授团队发布了 CUHK-X——国内首个融合 7 种模态的大型人体动作数据集。该数据集涵盖视觉、深度、骨架、惯性传感等模态，可用于评估大模型对人体行为的理解能力。初步测试揭示，当前主流多模态大模型在理解 "人为什么做这个动作" 和 "接下来会做什么" 方面存在显著短板。

关键事实：港中文发布国内首套 7 模态人体动作数据集，揭示大模型人体行为理解能力不足
后续看点：该数据集会否被纳入主流多模态模型的评测基准

来源：新智元

MemEye：给多模态 AI Agent 的长期记忆做了一次 "视觉体检"

智源研究院发布 MemEye 评测工具，专门针对多模态 AI Agent 的视觉长期记忆能力进行系统性测试。结果发现，当前主流的多模态 Agent 在超过 100 张图片的长期记忆中，召回准确率急剧下降，且在识别 "被修改过的旧图片" 方面的表现接近随机猜测。

关键事实：MemEye 测试揭示多模态 Agent 在超过 100 张图片后长期记忆召回率急剧下降
后续看点：多模态 Agent 的记忆增强方案（如 External Memory、RAG on Images）的评测对比

来源：BAAI 智源

语音大模型为什么一开口还是像客服？南大&小米论文揭示副语言能力短板

南京大学与小米联合发表的论文系统评测了语音大模型的 "副语言能力"——语气、情绪、停顿、潜台词和社交感。论文指出，当前语音模型在内容生成上已接近人类水平，但在 "怎么说"（而非 "说什么"）的维度上仍存在巨大鸿沟，这解释了为什么语音 AI 总给人一种 "客服感"。

关键事实：南大&小米论文系统评测语音大模型的副语言能力，揭示 "怎么说" 维度存在巨大鸿沟
后续看点：论文提出的 SpeechBench 评测基准是否被主要语音模型厂商采纳

来源：PaperWeekly

🔧 硬件算力与智能设备

NVIDIA 杀入 CPU 市场

极客公园报道，NVIDIA 正式进入 CPU 市场，发布面向 AI 数据中心的自研 CPU 产品线。这一动作延续了 NVIDIA 从 GPU 向全栈计算平台扩展的战略。同日，TSMC（台积电）盈利大增但传出削减奖金消息，员工酝酿罢工，半导体产业链正经历剧烈重组。

关键事实：NVIDIA 发布自研 CPU 进军 AI 数据中心市场；台积电盈利大增但削减奖金引员工不满
后续看点：Intel 和 AMD 在 AI CPU 赛道的应对策略；NVIDIA CPU 在 AI 推理中的每瓦性能表现

来源：极客公园

SoftBank 将于 2026 年 10 月推出 AI GPU 云服务

软银宣布将于 2026 年 10 月正式推出 AI GPU 云服务。作为日本最大的科技投资集团，软银的入局意味着 AI 算力租赁市场迎来了又一个重量级玩家。软银计划部署大规模 GPU 集群，面向日本和亚太地区的 AI 训练需求。

关键事实：软银将于 2026 年 10 月推出 AI GPU 云服务，部署大规模 GPU 集群
后续看点：软银 GPU 云与 AWS/Azure/阿里云在定价和生态上的差异化竞争

来源：Tech in Asia

IBM 分拆量子芯片代工厂：2 亿美元 CHIPS 法案投资押注 300mm 硅量子

IBM 宣布分拆出全球第一家纯量子芯片代工厂，获得美国 CHIPS 法案 2 亿美元投资。该代工厂将在 300mm 硅晶圆上制造超导量子比特，标志着量子计算从实验室小批量走向工业规模化生产。

关键事实：IBM 分拆量子芯片代工厂，获 2 亿美元投资，在 300mm 硅晶圆上量产超导量子比特
后续看点：300mm 量子芯片的良率和量子比特相干时间能否达到商业化门槛

来源：Futurum Group

华为发布 AI 数据中心基础设施全栈方案

华为发布了面向 AI 数据中心的全栈基础设施方案，涵盖从芯片到冷却系统的端到端技术栈。该方案整合了昇腾芯片、华为存储和网络设备，旨在为企业级 AI 训练和推理提供一站式部署方案。此前，挪威已部署了 2PB 华为闪存用于 LLM 训练。

关键事实：华为发布 AI 数据中心全栈基础设施方案，整合芯片、存储、网络
后续看点：华为数据中心方案在海外市场的竞争力（是否受出口管制影响）

来源：Tech in Asia

内容由AI辅助生成，请谨慎甄别。资讯分享仅供参考，相关观点不代表主观立场，不构成任何形式的投资建议。

🏠 返回首页