南方财经网 - 南方财经全媒体集团

每天烧百亿token，银行开始和AI算细账

21世纪经济报道 21财经APP
黄子潇 2026-07-04 11:11:00

21世纪经济报道记者黄子潇深圳报道

商业银行，正在每天燃烧百亿词元（Token），用来支撑业务发展。

今年6月，招商银行首席信息官周天虹在股东会上披露数据：截至今年5月底，招行日均Token消耗量已达330亿。大模型成本收入比维持在20%左右。

换句话说，招行认为，投入20元于人工智能，可创造100元收益。

几乎同期，多家银行披露Token消耗数据：

邮储银行股东会上披露称，日均大模型调用超600万次，日均输入、输出词元（Token）超百亿；
微众银行日均Token消耗已从2亿跃升至超50亿；
兴业银行上线超200个智能体，Token日均调用量约41亿；
浦发银行日均Token约60亿；
民生银行日均Token约40亿。

Token这一人工智能的计算单位，几乎成了银行衡量数字金融发展的参考指标，亦可能是银行的商业机密。

其中，由于不同的硬件、模型、API或自建网关等因素可能会使Token成本相差百倍，这一成本的估算变得复杂。粗略估计下，一家日均百亿Token的银行每日的成本支出也在数万元级别以上。

从“砸钱买卡、比拼场景”的上半场，头部银行正在迈入“精算Token、拷问ROI”的下半场。

Token算力狂欢

2025年，银行业在AI赛道上的投入可谓“不计成本”。15家披露金融科技相关投入的A股上市银行合计金融科技投入接近1900亿元。其中，六大国有银行投入均超百亿元，工商银行以285.88亿元领跑，招商银行以129.01亿元位列股份行第一。

除去原生化、线上化、数字化的互联网行业，金融行业可能是传统行业中对大模型投入和应用程度最高的行业。

某银行信息技术部负责人向21世纪经济报道记者表示，由于金融行业本身是数据密集型的行业，在大模型出现时已经具备了较好的数据基础、系统架构，以及配套的技术团队。

他表示，模型训练推理的算力投入是很大的开支。众所周知，购买GPU的成本很高，但是除去了GPU，可能还需要多机多卡互联，同时要购买高速网络设备。例如400G以上的交换机相较于传统交换机价格会贵很多。在提升GPU的算力、网络和存储性能的同时，随着计算密度的提高，业务的开支也会越来越大。

巨额AI投入的另一面，是银行业净息差持续承压、利润增长放缓的现实压力。

数据显示，中国银行业净息差已经连续六年下降，截至2025年年末，商业银行整体净息差已经降至1.42%左右。尽管净息差已连续三个季度维持在1.42%，呈现企稳迹象，但绝对水平仍处于历史低位。其中，股份制银行去年整体的净利润出现同比下降。

近期，美国公司Uber四个月烧光全年Token预算的案例引发了全球所有科技从业者的关注。在这个案例中，尽管该公司Token消耗量激增，但AI成本越来越难以合理化，且难以证明支出与终端用户体验的实质性提升、交付之间存在明确的逻辑关系。

作为传统金融机构，银行并非科技公司，更不能只靠想象空间定价。算力狂欢背后的成本压力再也无法回避。

在此背景下，科技公司以及对AI应用较多的金融业，均开始“精打细算”。

PNC金融服务集团CEO Bill Demchak有一个清晰的判断：任何AI对银行生产力的提升，都可能被Token成本吞噬。

目前，银行业的智能体建设更加关注在成本预算有限的情况下，优先赋能哪些业务板块，以及如何在调用消耗最少的Token前提下让AI达成相同目标。

上述银行信息技术部负责人表示，该行在AI上的投入可以分为两大部分，第一部分是硬件，硬件也是最大的成本，涵盖数千张AI算力卡，目前仍在持续扩容；第二部分是研发投入。该行在推理框架、训练框架以及模型微调方面投入了大量资源和研发人员，以提升当前AI的推广效果。

他进一步表示，目前大模型的能力密度（能力评分除以参数量）正在持续提升，这意味着，可以在同参数规模下让模型能力更强，以及同业务效果下减少模型参数规模。对于时效性更高的业务，可以在不牺牲业务效果的情况下，选择相对小尺寸的模型来提升效率。

Token竞赛成本压力

梳理主要银行的Token消耗数据，银行业对AI的应用速度可见一斑。

工商银行至2026年初日均Token消耗量已达百亿级，较两年前增长近百倍。“工银智涌”体系在30余个业务领域落地500余个AI应用，AI数字员工年承担工作量5.5万人年。个人金融AI助理将产品匹配时间从约1小时缩短至2至3分钟；对客外汇交易智能询价比率超96%。

邮储银行在股东会上披露已落地超370个大模型应用场景，日均调用超600万次，日均Token超百亿，并明确提出到2026年底日均Token吞吐量突破300亿的目标。其中，零售营销智能体已触达超5400万名高潜客户。

股份制银行中，招商银行日均Token消耗量达330亿；兴业银行已上线超200个智能体，日均Token约41亿，由董事长挂帅推动；浦发银行日均Token约60亿，大模型日均调用超400万次；民生银行日均Token约40亿，覆盖260个细分场景；光大银行明确将Token消耗规模持续增长作为衡量AI深度应用的核心指标。

民营银行的代表微众银行正全面推进“AI原生银行”战略，日均Token消耗从2亿跃升至超50亿，已构建70余个数字员工及超800个智能体。

据国家数据局统计，2024年初，我国日均Token调用量仅为1000亿，至2026年3月已突破140万亿，两年增长超千倍，银行业正是这一爆炸式增长的推手之一。

与此同时，银行的采购逻辑也在生变。2026年5月下旬至6月初，江苏农商行、广州银行、中国银行安徽省分行、邮储银行山东省分行、秦皇岛银行等密集发布AI采购公告，但与2025年以底层平台为主不同，今年金融智能体招标全面铺开，采购从“买卡”转向“算账”，即如何在调用最少Token的前提下让AI达成相同目标，成为新焦点。

神州信息AI创新中心总经理晋梅博士在接受媒体采访时，将银行业AI心态迭代划分为三个阶段：2025年上半年，DeepSeek引发“算力焦虑”，银行纷纷采购服务器、部署模型；下半年，话题转向“智能体”和“场景”，相关项目以每季度翻几倍的速度增长；进入2026年，大家不再比拼上了多少个场景，而是开始追问ROI（投入产出比）。

成本会否吞噬业务

在这场“算账潮”中，招商银行提供了一个股份制银行的样本。

周天虹表示，Uber案例反映的Token消耗超预算问题，主要是其科技部门将大模型用于编写代码导致，而非源于业务部门将大模型用于经营管理。

在此背景下，招行在AI应用上采取了“业务端积极、开发端审慎”的策略。

他表示，大模型编写代码的成本十分高昂，原因在于大模型的软件架构能力偏弱，以及技术债问题，例如容易生成难以阅读的“面条式代码”和性能问题、安全问题等。

基于此判断，招行用于大模型编程的算力投入仅占总算力的5%，而330亿的日均Token消耗量主要由业务部门产生。

他进一步透露，招行在提出“AI First”战略之前，已在科技条线建立了一套相对完整的成本收益度量体系。成本端细分为研发人员投入及Token费用；收益端则建立了六个维度的度量体系，包括银行视角四个维度、客户视角两个维度。

“当前招行大模型的成本收入比，我们测算大概在20%上下，即投入20元可创造100元收益。”周天虹还直言，成本数据能算得很精准，但收益度量比较复杂，因为银行的价值链条本身就比较复杂。

除了成本收益比，招行还引入了一个重要指标“AI贡献比”，即AI处理业务的对应工时和人类员工实际投入工时之比。这一指标从去年底的1:13.5提升至今年5月底的接近1:9，提升幅度不小。2025年全年，招行实现1556万小时的人工替代，相当于产生了超过8000人的全职人工效率。

具体到业务层面，零售端面向超1万名金葵花客户经理的“RM小助”已推动人均有效触客次数提升14%，客均交易规模提升20%；对公端小企业尽调报告编写82%的工作量已由大模型替代，在线风控平台审批对公信贷规模接近6000亿元，同比增长44%。

据悉，招行2025年科技总投入为130亿元左右，其中算力采购投入占比不算高，未来加大AI算力投入的空间较大。

下半场的胜负手

2025年是银行业AI从试点走向规模化的关键年份。进入2026年，竞争逻辑正在重构。

周天虹明确了招行的长期愿景为打造一家智能银行，但他坦言这还需要一些时间，也有非常高的复杂度。目前，招行还在进一步细化和深化指标体系。

尽管短期算力成本可能上升，但长期来看，AI仍是银行业削减成本的重要抓手。麦肯锡指出，随着AI全面应用，银行整体成本基数的净降幅仍能达到15%至20%。

上述银行信息技术部负责人向21世纪经济报道记者表示，该行在技术层面上有一些趋势性的洞察。理论上Token肯定会越来越便宜，有说法称每Token成本每年大约降10倍，从初步的这几年看，这个论断还是有效的。

“当成本越来越低的时候，整个大模型的ROI就会持续上升，特别是需要更多上下文交互、更多轮次的场景，例如私行的资产配置场景。”

关于成本目标，他透露，近期公有云普遍涨价，该行目前每百万Token的成本已低于公有云水平。不过，由于技术和管理能力差异，部分机构的Token成本可能是公有云的几倍，客观上无法做到大规模推广。

Token经济学，正在成为银行业AI时代的一门必修课。而那些率先建立成本收益度量体系、敢于公布“20元赚100元”账本的银行，正在这场从“有没有”到“算不算得清”的竞赛中，抢占下一个五年的制高点。

首页

快讯

智库

视频

音频

全站地图

全部频道

数据

城市通理财通基金通