AI成本经济学:从Token大通胀到算力网络

日期:2026/05/18

核心判断

AI产业正在从"模型能力竞赛"进入"成本经济学竞赛"阶段。Token调用量在中国年增超1000倍、头部应用月账单突破130万美元、Agent执行路径消耗超出预期千倍——这些信号共同表明,AI的经济可行性正在取代技术可行性,成为产业下一个瓶颈与机会所在。中国以"算力网+Token套餐"的国家基础设施模式回应这一挑战。

发生了什么

30天6030亿Token,月账单130万美元

5月17日,AI SDK作者、被称为"龙虾之父"的Peter Steinberger公开晒出自己的API使用数据:30天Token消耗量为6030亿,请求量760万,月花费超过130万美元。这笔费用由OpenAI以合作伙伴关系全额承担。

华尔街见闻评论称,"雇一支开发团队可能都没这么贵"——这并非夸张。按美国高级工程师年薪30万美元计算,130万美元/月的Token账单约等于50名高级工程师的年薪。

AI Agent的执行路径膨胀

机器之心同日发表分析文章,对8个frontier模型在swe-bench-verified基准上的执行轨迹进行了实证研究。结论是:AI Agent在自主执行任务时,token消耗远超预期——即便多花1000倍的token,效果不一定成比例提升。

这种"隐性账单"来自Agent的多步推理、工具调用、重试和自我纠错。工程师们面临一个困境:让Agent更可靠需要更长的推理链,但推理链越长,token成本越失控。

中国日均Token调用量突破140万亿

华尔街见闻5月17日报道,今年3月,我国日均Token调用量已超140万亿,相比2024年初增长1000多倍。AI模型使用成本水涨船高,从业者负担加重。

中国的回应:算力网与Token套餐

为什么值得关注

华尔街见闻引用的一个类比回应了这个问题:Token基础设施的发展轨迹,可能类似4G/5G网络。移动互联网早期流量昂贵,但随着基础设施普及,流量从稀缺品变为日用品。

但有一个根本性差异:流量是商品,token则是半成品——它背后绑定了模型推理的算力成本。数据流量可以通过扩容边际成本趋近零,但算力同时受制于芯片产能、能源供给和制程工艺。这就是为什么无论Token工厂、算力网还是运营商Token套餐,"供应端降本"与"需求端省Token"都需要同时推进。

可能影响

参考文献


前沿科技异动雷达 2026/05/18