
21世纪经济报道记者黄子潇深圳报道
商业银行,正在每天燃烧百亿词元(Token),用来支撑业务发展。
今年6月,招商银行首席信息官周天虹在股东会上披露数据:截至今年5月底,招行日均Token消耗量已达330亿。大模型成本收入比维持在20%左右。
换句话说,招行认为,投入20元于人工智能,可创造100元收益。
几乎同期,多家银行披露Token消耗数据:
- 邮储银行股东会上披露称,日均大模型调用超600万次,日均输入、输出词元(Token)超百亿;
- 微众银行日均Token消耗已从2亿跃升至超50亿;
- 兴业银行上线超200个智能体,Token日均调用量约41亿;
- 浦发银行日均Token约60亿;
- 民生银行日均Token约40亿。
Token这一人工智能的计算单位,几乎成了银行衡量数字金融发展的参考指标,亦可能是银行的商业机密。
其中,由于不同的硬件、模型、API或自建网关等因素可能会使Token成本相差百倍,这一成本的估算变得复杂。粗略估计下,一家日均百亿Token的银行每日的成本支出也在数万元级别以上。
从“砸钱买卡、比拼场景”的上半场,头部银行正在迈入“精算Token、拷问ROI”的下半场。
Token算力狂欢
2025年,银行业在AI赛道上的投入可谓“不计成本”。15家披露金融科技相关投入的A股上市银行合计金融科技投入接近1900亿元。其中,六大国有银行投入均超百亿元,工商银行以285.88亿元领跑,招商银行以129.01亿元位列股份行第一。
除去原生化、线上化、数字化的互联网行业,金融行业可能是传统行业中对大模型投入和应用程度最高的行业。
某银行信息技术部负责人向21世纪经济报道记者表示,由于金融行业本身是数据密集型的行业,在大模型出现时已经具备了较好的数据基础、系统架构,以及配套的技术团队。
他表示,模型训练推理的算力投入是很大的开支。众所周知,购买GPU的成本很高,但是除去了GPU,可能还需要多机多卡互联,同时要购买高速网络设备。例如400G以上的交换机相较于传统交换机价格会贵很多。在提升GPU的算力、网络和存储性能的同时,随着计算密度的提高,业务的开支也会越来越大。
巨额AI投入的另一面,是银行业净息差持续承压、利润增长放缓的现实压力。
数据显示,中国银行业净息差已经连续六年下降,截至2025年年末,商业银行整体净息差已经降至1.42%左右。尽管净息差已连续三个季度维持在1.42%,呈现企稳迹象,但绝对水平仍处于历史低位。其中,股份制银行去年整体的净利润出现同比下降。
近期,美国公司Uber四个月烧光全年Token预算的案例引发了全球所有科技从业者的关注。在这个案例中,尽管该公司Token消耗量激增,但AI成本越来越难以合理化,且难以证明支出与终端用户体验的实质性提升、交付之间存在明确的逻辑关系。
作为传统金融机构,银行并非科技公司,更不能只靠想象空间定价。算力狂欢背后的成本压力再也无法回避。
在此背景下,科技公司以及对AI应用较多的金融业,均开始“精打细算”。
PNC金融服务集团CEO Bill Demchak有一个清晰的判断:任何AI对银行生产力的提升,都可能被Token成本吞噬。
目前,银行业的智能体建设更加关注在成本预算有限的情况下,优先赋能哪些业务板块,以及如何在调用消耗最少的Token前提下让AI达成相同目标。
上述银行信息技术部负责人表示,该行在AI上的投入可以分为两大部分,第一部分是硬件,硬件也是最大的成本,涵盖数千张AI算力卡,目前仍在持续扩容;第二部分是研发投入。该行在推理框架、训练框架以及模型微调方面投入了大量资源和研发人员,以提升当前AI的推广效果。
他进一步表示,目前大模型的能力密度(能力评分除以参数量)正在持续提升,这意味着,可以在同参数规模下让模型能力更强,以及同业务效果下减少模型参数规模。对于时效性更高的业务,可以在不牺牲业务效果的情况下,选择相对小尺寸的模型来提升效率。
Token竞赛成本压力
梳理主要银行的Token消耗数据,银行业对AI的应用速度可见一斑。
工商银行至2026年初日均Token消耗量已达百亿级,较两年前增长近百倍。“工银智涌”体系在30余个业务领域落地500余个AI应用,AI数字员工年承担工作量5.5万人年。个人金融AI助理将产品匹配时间从约1小时缩短至2至3分钟;对客外汇交易智能询价比率超96%。
邮储银行在股东会上披露已落地超370个大模型应用场景,日均调用超600万次,日均Token超百亿,并明确提出到2026年底日均Token吞吐量突破300亿的目标。其中,零售营销智能体已触达超5400万名高潜客户。
股份制银行中,招商银行日均Token消耗量达330亿;兴业银行已上线超200个智能体,日均Token约41亿,由董事长挂帅推动;浦发银行日均Token约60亿,大模型日均调用超400万次;民生银行日均Token约40亿,覆盖260个细分场景;光大银行明确将Token消耗规模持续增长作为衡量AI深度应用的核心指标。
民营银行的代表微众银行正全面推进“AI原生银行”战略,日均Token消耗从2亿跃升至超50亿,已构建70余个数字员工及超800个智能体。
据国家数据局统计,2024年初,我国日均Token调用量仅为1000亿,至2026年3月已突破140万亿,两年增长超千倍,银行业正是这一爆炸式增长的推手之一。
与此同时,银行的采购逻辑也在生变。2026年5月下旬至6月初,江苏农商行、广州银行、中国银行安徽省分行、邮储银行山东省分行、秦皇岛银行等密集发布AI采购公告,但与2025年以底层平台为主不同,今年金融智能体招标全面铺开,采购从“买卡”转向“算账”,即如何在调用最少Token的前提下让AI达成相同目标,成为新焦点。
神州信息AI创新中心总经理晋梅博士在接受媒体采访时,将银行业AI心态迭代划分为三个阶段:2025年上半年,DeepSeek引发“算力焦虑”,银行纷纷采购服务器、部署模型;下半年,话题转向“智能体”和“场景”,相关项目以每季度翻几倍的速度增长;进入2026年,大家不再比拼上了多少个场景,而是开始追问ROI(投入产出比)。
成本会否吞噬业务
在这场“算账潮”中,招商银行提供了一个股份制银行的样本。
周天虹表示,Uber案例反映的Token消耗超预算问题,主要是其科技部门将大模型用于编写代码导致,而非源于业务部门将大模型用于经营管理。
在此背景下,招行在AI应用上采取了“业务端积极、开发端审慎”的策略。
他表示,大模型编写代码的成本十分高昂,原因在于大模型的软件架构能力偏弱,以及技术债问题,例如容易生成难以阅读的“面条式代码”和性能问题、安全问题等。
基于此判断,招行用于大模型编程的算力投入仅占总算力的5%,而330亿的日均Token消耗量主要由业务部门产生。
他进一步透露,招行在提出“AI First”战略之前,已在科技条线建立了一套相对完整的成本收益度量体系。成本端细分为研发人员投入及Token费用;收益端则建立了六个维度的度量体系,包括银行视角四个维度、客户视角两个维度。
“当前招行大模型的成本收入比,我们测算大概在20%上下,即投入20元可创造100元收益。”周天虹还直言,成本数据能算得很精准,但收益度量比较复杂,因为银行的价值链条本身就比较复杂。
除了成本收益比,招行还引入了一个重要指标“AI贡献比”,即AI处理业务的对应工时和人类员工实际投入工时之比。这一指标从去年底的1:13.5提升至今年5月底的接近1:9,提升幅度不小。2025年全年,招行实现1556万小时的人工替代,相当于产生了超过8000人的全职人工效率。
具体到业务层面,零售端面向超1万名金葵花客户经理的“RM小助”已推动人均有效触客次数提升14%,客均交易规模提升20%;对公端小企业尽调报告编写82%的工作量已由大模型替代,在线风控平台审批对公信贷规模接近6000亿元,同比增长44%。
据悉,招行2025年科技总投入为130亿元左右,其中算力采购投入占比不算高,未来加大AI算力投入的空间较大。
下半场的胜负手
2025年是银行业AI从试点走向规模化的关键年份。进入2026年,竞争逻辑正在重构。
周天虹明确了招行的长期愿景为打造一家智能银行,但他坦言这还需要一些时间,也有非常高的复杂度。目前,招行还在进一步细化和深化指标体系。
尽管短期算力成本可能上升,但长期来看,AI仍是银行业削减成本的重要抓手。麦肯锡指出,随着AI全面应用,银行整体成本基数的净降幅仍能达到15%至20%。
上述银行信息技术部负责人向21世纪经济报道记者表示,该行在技术层面上有一些趋势性的洞察。理论上Token肯定会越来越便宜,有说法称每Token成本每年大约降10倍,从初步的这几年看,这个论断还是有效的。
“当成本越来越低的时候,整个大模型的ROI就会持续上升,特别是需要更多上下文交互、更多轮次的场景,例如私行的资产配置场景。”
关于成本目标,他透露,近期公有云普遍涨价,该行目前每百万Token的成本已低于公有云水平。不过,由于技术和管理能力差异,部分机构的Token成本可能是公有云的几倍,客观上无法做到大规模推广。
Token经济学,正在成为银行业AI时代的一门必修课。而那些率先建立成本收益度量体系、敢于公布“20元赚100元”账本的银行,正在这场从“有没有”到“算不算得清”的竞赛中,抢占下一个五年的制高点。

