21世纪经济报道记者彭新
云计算市场掀起涨价潮。继亚马逊AWS、谷歌云、腾讯云相继释放涨价信号后,阿里云与百度云也在同一天内宣布上调价格。
3月18日,阿里云官网发布公告称,因全球AI需求爆发及供应链成本上涨,阿里云旗下AI算力、存储等产品将上调价格,涨幅最高达34%。其中,平头哥真武810E等算力卡产品涨幅介于5%至34%之间,文件存储产品CPFS(智算版)上涨30%。
同日,百度智能云发布AI算力、存储等产品调价公告称,受全球人工智能应用快速发展影响,算力需求持续攀升。核心硬件及相关基础设施成本出现显著上涨。为保障平台长期稳定运行与服务质量,拟对部分产品价格进行结构性优化。
至此,国内外主流云服务商已基本加入涨价大军。

云服务涨价潮蔓延
2026年初以来,全球云计算厂商已相继释放涨价信号。亚马逊AWS和谷歌云均于年初公布部分服务涨价,其中谷歌云对CDN Interconnect、Direct Peering、Carrier Peering等数据传输服务价格进行了大幅调整,北美地区涨幅达到100%。
国内方面,腾讯云于3月11日宣布大模型服务涨价。腾讯云称,为持续提供稳定优质的服务,腾讯云智能体开发平台对部分模型的计费策略进行了调整。以Tencent HY2.0 Instruct模型为例,其输入价格由原先的0.0008元/千Tokens大幅上调至0.004505元/千Tokens,涨幅高达463.13%。
3月16日,智谱宣布推出面向开源智能体框架OpenClaw(即“龙虾”)场景的基座模型GLM-5-Turbo,这也是其近期推出的首个闭源模型,同时,智谱上调新模型API价格20%,这也是智谱近期第二次涨价。粗略计算,GLM-5-Turbo相对GLM-4.7平均上涨83%,API价格接近翻倍,量价双增趋势明显。
记者梳理还发现,“数据传输与网络”项目已成为本轮云服务涨价的重灾区,相关服务涨幅普遍集中在10%至40%之间。包括亚马逊AWS、谷歌云、微软Azure以及腾讯云、网宿科技在内的头部厂商,都将数据传输或网络相关服务列入涨价范围。这一趋势表明,云厂商正将日益攀升的带宽与网络基础设施成本向用户端传导。
此外,调价潮中也不乏极端案例,例如谷歌云北美地区的特定网络服务价格直接翻番。从调价节奏来看,大厂们的调价步伐十分紧凑,几乎每个月都有一家头部厂商宣布涨价,呈现出明显的行业跟进效应。
算力紧张倒逼云厂商再定价
CDN服务商网宿科技产品总监王志杰告诉记者,云计算价格战阶段已经结束,行业进入价值回归周期,标志着行业从“规模优先”转向“利润优先”的理性定价阶段。
他表示,此轮涨价并非简单的价格周期波动,而是AI算力供需失衡下的被动性市场应对。供给侧GPU、存储、带宽、电力成本刚性上涨且迭代加速,需求侧AI训练和推理需求爆发,资源稀缺性凸显。
就需求结构而言,王志杰观察到,从2025年到今年一季度,市场整体呈现“训练需求平稳、推理需求指数级增长”的特征。行业数据显示,大模型API调用量月环比增速达30%,视频生成、实时交互类应用则持续推动边缘推理算力需求激增。
“传统云服务遵循‘摩尔定律+规模效应’的降本路径,但AI算力的边际成本会随着规模扩大而上升,这就导致厂商陷入‘卖得越多亏得越多’的倒挂困境。”有云服务行业从业者表示,在生存压力倒逼下,行业通过结构性涨价修复利润率,是行业走向成熟表现。
与此同时,AI应用对底层基础设施的要求也在迅速抬升。前述云服务行业从业者解释,当前平台面临的挑战已不只是有没有资源,更在于能否高效调度资源,例如如何实现CPU、GPU、FPGA等异构资源的混合调度,如何支持AI任务在边缘、中心和云之间无缝迁移,以及如何压缩大模型边缘加载时延、应对单机柜功率快速提升后带来的液冷和供电改造压力。
“网络传输是云厂商第二大成本项,仅次于计算,CDN跟进涨价也是大势所趋。” 王志杰告诉记者,在AI时代,低延迟的推理服务必须依赖边缘节点与中心云之间的智能互联,平台在内容合规、安全性、稳定性与弹性等方面也面临更高要求。在他看来,CDN的角色已发生根本性转变——“从内容分发升级为集传输、算力、推理于一体的分布式算力调度网络”。
Agent热潮推波助澜
从阿里云本次涨价来看,此轮涨价的另一个重要驱动因素是“Token调用量暴涨”。据知情人士透露,阿里云旗下MaaS业务平台百炼在今年1月至3月创下历史最高增速,阿里云正将紧缺的AI算力资源向Token推理业务倾斜。
从趋势上看,最新的AI模型正在进行更多“思考”,尤其是在深度研究、AI Agent和代码生成等领域。因此,虽然Token价格在持续下降,但完成多项任务所需的Token数量却在急剧增加。
观察来看,随着开源AI Agent框架OpenClaw在开发者社区迅速走红,AI应用开始从聊天机器人形态转向能够长期运行、执行复杂任务的Agent。
全球最大的AI模型API聚合平台OpenRouter平台数据显示,OpenClaw的Token消耗量从2026年2月3日的806亿,在一个月内飙升至3月4日的3580亿,增长了约3.4倍;到3月2日当周,OpenRouter平台周度Token调用量已达14.8万亿,两个月内增长约160%,且OpenClaw贡献其中的绝大部分。根据Anthropic的数据,AI Agent的Token消耗量最高可达普通聊天交互的15倍。
3月17日,在2026年GPU技术大会(GTC)期间,英伟达CEO黄仁勋表示,AI Agent工作时,一项任务往往需要多个模型与工具反复调用推理能力,从而带来数量级增长的Token消耗。
华泰证券指出,类Claw产品加快发布,或将推动Agent加速演进,也带动Token消耗、推理算力需求以及相关基础设施投入继续上行。
“龙虾”的火爆进一步催化了云资源紧张。由于“龙虾”对Token的消耗呈指数级增长,对应传导到底层算力、带宽的消耗也将出现可预期的爆发式增长,这可能扩大行业内的涨价幅度,也可能提前涨价时点。
根据IDC预测,随着AI Agent处理任务日趋复杂,其推理深度与调用链路不断延伸,将驱动底层Token消耗呈数量级跃升。数据显示,年度Token消耗量预计将从2025年的0.0005 Peta Tokens(1 Peta=1000万亿)激增至2030年的152667 Peta Tokens,年复合增长率高达3418%。
“面对Token消耗的指数级增长,成本与能耗将成为关键制约因素。企业需要在算力资源、模型选择和搭配上做前瞻规划。”IDC中国高级研究经理孙振亚建议。

