AI成本经济学:从Token大通胀到算力网络
日期:2026/05/18
核心判断
AI产业正在从"模型能力竞赛"进入"成本经济学竞赛"阶段。Token调用量在中国年增超1000倍、头部应用月账单突破130万美元、Agent执行路径消耗超出预期千倍——这些信号共同表明,AI的经济可行性正在取代技术可行性,成为产业下一个瓶颈与机会所在。中国以"算力网+Token套餐"的国家基础设施模式回应这一挑战。
发生了什么
30天6030亿Token,月账单130万美元
5月17日,AI SDK作者、被称为"龙虾之父"的Peter Steinberger公开晒出自己的API使用数据:30天Token消耗量为6030亿,请求量760万,月花费超过130万美元。这笔费用由OpenAI以合作伙伴关系全额承担。
华尔街见闻评论称,"雇一支开发团队可能都没这么贵"——这并非夸张。按美国高级工程师年薪30万美元计算,130万美元/月的Token账单约等于50名高级工程师的年薪。
AI Agent的执行路径膨胀
机器之心同日发表分析文章,对8个frontier模型在swe-bench-verified基准上的执行轨迹进行了实证研究。结论是:AI Agent在自主执行任务时,token消耗远超预期——即便多花1000倍的token,效果不一定成比例提升。
这种"隐性账单"来自Agent的多步推理、工具调用、重试和自我纠错。工程师们面临一个困境:让Agent更可靠需要更长的推理链,但推理链越长,token成本越失控。
中国日均Token调用量突破140万亿
华尔街见闻5月17日报道,今年3月,我国日均Token调用量已超140万亿,相比2024年初增长1000多倍。AI模型使用成本水涨船高,从业者负担加重。
中国的回应:算力网与Token套餐
- 5月15日,首个"东数西算、算电融合"的特大型Token工厂在无锡签约。项目由弘信电子联手无锡高新区打造,首期建设华为昇腾384超节点算力集群。
- 5月17日,中国电信推出试商用Token套餐,提供"Token+连接+安全"一体化服务,同时推出天翼Token币和Token权益。
- 上海电信已推出全球首个Token算力套餐,用户可以像充话费一样购买AI算力。
为什么值得关注
华尔街见闻引用的一个类比回应了这个问题:Token基础设施的发展轨迹,可能类似4G/5G网络。移动互联网早期流量昂贵,但随着基础设施普及,流量从稀缺品变为日用品。
但有一个根本性差异:流量是商品,token则是半成品——它背后绑定了模型推理的算力成本。数据流量可以通过扩容边际成本趋近零,但算力同时受制于芯片产能、能源供给和制程工艺。这就是为什么无论Token工厂、算力网还是运营商Token套餐,"供应端降本"与"需求端省Token"都需要同时推进。
可能影响
- 参考文章中明确判断:AI产业正面临EPS上调速度和利率上行速度的较量(华尔街见闻),短期通胀效应与长期通缩潜力并存
- 中国通过"国芯国模国用"战略构建国产算力生态,弘信电子、华为昇腾等成为算力国产化的关键节点
- Token成本问题正推动工具层创新——Hacker News同日出现Semble开源项目,声称可让Agent代码搜索比grep节省98%的token
参考文献
- 一个月狂烧130万美元!龙虾之父自曝token账单,费用OpenAI全包(华尔街见闻)
- 花了1000倍的token,效果可能却没有更好:AI Agent的"隐性账单"长什么样(机器之心)
- 算力网要来了!(华尔街见闻)
前沿科技异动雷达 2026/05/18
- 【组织变化】月之暗面Kimi Code团队负责人离职。AI前线报道,离职者曾为K2.5核心贡献者,同一周MiniMax推出兼职期权策略,中国AI人才争夺进入白热化阶段。
- 【商业融资】Anthropic正以9000亿美元估值寻求至少300亿美元融资。钛媒体报道,若成功将成为全球估值最高未上市科技公司,同期Anthropic CEO Dario Amodei称Claude新功能几乎完全由AI自主开发。
- 【安全隐私】AI可从高清自拍照中窃取指纹。极客公园援引最新研究警告称,现代AI技术已能从高分辨率自拍照片中提取指纹信息。OpenAI同期在美国遭集体诉讼,AI安全与隐私风险持续攀升。