南方财经网 - 南方财经全媒体集团

Agent推高需求，全球云计算巨头集体涨价

21世纪经济报道 21财经APP
彭新 2026-03-18 19:37:27

21世纪经济报道记者彭新

云计算市场掀起涨价潮。继亚马逊AWS、谷歌云、腾讯云相继释放涨价信号后，阿里云与百度云也在同一天内宣布上调价格。

3月18日，阿里云官网发布公告称，因全球AI需求爆发及供应链成本上涨，阿里云旗下AI算力、存储等产品将上调价格，涨幅最高达34%。其中，平头哥真武810E等算力卡产品涨幅介于5%至34%之间，文件存储产品CPFS（智算版）上涨30%。

同日，百度智能云发布AI算力、存储等产品调价公告称，受全球人工智能应用快速发展影响，算力需求持续攀升。核心硬件及相关基础设施成本出现显著上涨。为保障平台长期稳定运行与服务质量，拟对部分产品价格进行结构性优化。

至此，国内外主流云服务商已基本加入涨价大军。

云服务涨价潮蔓延

2026年初以来，全球云计算厂商已相继释放涨价信号。亚马逊AWS和谷歌云均于年初公布部分服务涨价，其中谷歌云对CDN Interconnect、Direct Peering、Carrier Peering等数据传输服务价格进行了大幅调整，北美地区涨幅达到100%。

国内方面，腾讯云于3月11日宣布大模型服务涨价。腾讯云称，为持续提供稳定优质的服务，腾讯云智能体开发平台对部分模型的计费策略进行了调整。以Tencent HY2.0 Instruct模型为例，其输入价格由原先的0.0008元/千Tokens大幅上调至0.004505元/千Tokens，涨幅高达463.13%。

3月16日，智谱宣布推出面向开源智能体框架OpenClaw（即“龙虾”）场景的基座模型GLM-5-Turbo，这也是其近期推出的首个闭源模型，同时，智谱上调新模型API价格20%，这也是智谱近期第二次涨价。粗略计算，GLM-5-Turbo相对GLM-4.7平均上涨83%，API价格接近翻倍，量价双增趋势明显。

记者梳理还发现，“数据传输与网络”项目已成为本轮云服务涨价的重灾区，相关服务涨幅普遍集中在10%至40%之间。包括亚马逊AWS、谷歌云、微软Azure以及腾讯云、网宿科技在内的头部厂商，都将数据传输或网络相关服务列入涨价范围。这一趋势表明，云厂商正将日益攀升的带宽与网络基础设施成本向用户端传导。

此外，调价潮中也不乏极端案例，例如谷歌云北美地区的特定网络服务价格直接翻番。从调价节奏来看，大厂们的调价步伐十分紧凑，几乎每个月都有一家头部厂商宣布涨价，呈现出明显的行业跟进效应。

算力紧张倒逼云厂商再定价

CDN服务商网宿科技产品总监王志杰告诉记者，云计算价格战阶段已经结束，行业进入价值回归周期，标志着行业从“规模优先”转向“利润优先”的理性定价阶段。

他表示，此轮涨价并非简单的价格周期波动，而是AI算力供需失衡下的被动性市场应对。供给侧GPU、存储、带宽、电力成本刚性上涨且迭代加速，需求侧AI训练和推理需求爆发，资源稀缺性凸显。

就需求结构而言，王志杰观察到，从2025年到今年一季度，市场整体呈现“训练需求平稳、推理需求指数级增长”的特征。行业数据显示，大模型API调用量月环比增速达30%，视频生成、实时交互类应用则持续推动边缘推理算力需求激增。

“传统云服务遵循‘摩尔定律+规模效应’的降本路径，但AI算力的边际成本会随着规模扩大而上升，这就导致厂商陷入‘卖得越多亏得越多’的倒挂困境。”有云服务行业从业者表示，在生存压力倒逼下，行业通过结构性涨价修复利润率，是行业走向成熟表现。

与此同时，AI应用对底层基础设施的要求也在迅速抬升。前述云服务行业从业者解释，当前平台面临的挑战已不只是有没有资源，更在于能否高效调度资源，例如如何实现CPU、GPU、FPGA等异构资源的混合调度，如何支持AI任务在边缘、中心和云之间无缝迁移，以及如何压缩大模型边缘加载时延、应对单机柜功率快速提升后带来的液冷和供电改造压力。

“网络传输是云厂商第二大成本项，仅次于计算，CDN跟进涨价也是大势所趋。” 王志杰告诉记者，在AI时代，低延迟的推理服务必须依赖边缘节点与中心云之间的智能互联，平台在内容合规、安全性、稳定性与弹性等方面也面临更高要求。在他看来，CDN的角色已发生根本性转变——“从内容分发升级为集传输、算力、推理于一体的分布式算力调度网络”。

Agent热潮推波助澜

从阿里云本次涨价来看，此轮涨价的另一个重要驱动因素是“Token调用量暴涨”。据知情人士透露，阿里云旗下MaaS业务平台百炼在今年1月至3月创下历史最高增速，阿里云正将紧缺的AI算力资源向Token推理业务倾斜。

从趋势上看，最新的AI模型正在进行更多“思考”，尤其是在深度研究、AI Agent和代码生成等领域。因此，虽然Token价格在持续下降，但完成多项任务所需的Token数量却在急剧增加。

观察来看，随着开源AI Agent框架OpenClaw在开发者社区迅速走红，AI应用开始从聊天机器人形态转向能够长期运行、执行复杂任务的Agent。

全球最大的AI模型API聚合平台OpenRouter平台数据显示，OpenClaw的Token消耗量从2026年2月3日的806亿，在一个月内飙升至3月4日的3580亿，增长了约3.4倍；到3月2日当周，OpenRouter平台周度Token调用量已达14.8万亿，两个月内增长约160%，且OpenClaw贡献其中的绝大部分。根据Anthropic的数据，AI Agent的Token消耗量最高可达普通聊天交互的15倍。

3月17日，在2026年GPU技术大会（GTC）期间，英伟达CEO黄仁勋表示，AI Agent工作时，一项任务往往需要多个模型与工具反复调用推理能力，从而带来数量级增长的Token消耗。

华泰证券指出，类Claw产品加快发布，或将推动Agent加速演进，也带动Token消耗、推理算力需求以及相关基础设施投入继续上行。

“龙虾”的火爆进一步催化了云资源紧张。由于“龙虾”对Token的消耗呈指数级增长，对应传导到底层算力、带宽的消耗也将出现可预期的爆发式增长，这可能扩大行业内的涨价幅度，也可能提前涨价时点。

根据IDC预测，随着AI Agent处理任务日趋复杂，其推理深度与调用链路不断延伸，将驱动底层Token消耗呈数量级跃升。数据显示，年度Token消耗量预计将从2025年的0.0005 Peta Tokens（1 Peta=1000万亿）激增至2030年的152667 Peta Tokens，年复合增长率高达3418%。

“面对Token消耗的指数级增长，成本与能耗将成为关键制约因素。企业需要在算力资源、模型选择和搭配上做前瞻规划。”IDC中国高级研究经理孙振亚建议。

首页

快讯

智库

视频

音频

全站地图

全部频道

数据

城市通理财通基金通