

近期,布局AI智能体的热潮正席卷各行业。AI智能体正以前所未有的速度融入日常的工作与生活场景中。
而这场热潮的背后,是呈指数级爆发的算力需求——个人AI智能体的大规模落地带来了海量Token(计算机领域数字标识符)消耗,迅速击穿了大模型厂商原有的成本防线。
近期,北京智谱华章科技股份有限公司(以下简称“智谱”)、腾讯云等国内AI厂商密集发布AI算力产品涨价通知,部分产品涨幅甚至超过400%。这场从“烧钱换增长”到“以价补量”的战略急转,不仅标志着行业告别野蛮生长,更折射出AI智能体时代算力供需关系的深刻变局。
大模型定价体系再造
大模型行业的定价体系正在经历系统性再造,国内厂商也在加速上调相关产品价格。这番涨价现象,与两年前的价格战形成鲜明对比。
2024年5月份,字节跳动率先打响价格战第一枪,豆包Pro模型定价0.0008元/千Token,较行业均价低99.3%。随后阿里云通义千问主力模型降价97%,百度文心大模型两大主力模型全面免费,腾讯混元大模型价格降幅最高达87.5%。一时间,行业陷入降价潮。
“那时候的逻辑很简单:先让开发者用起来,市场份额比什么都重要。”一位从业三年的AI产品经理对《证券日报》记者透露,2024年某头部厂商内部曾定下三年内不考虑盈利的激进目标,产品定价甚至低于算力成本。
然而,低价策略的边际效应迅速递减。有行业分析师对《证券日报》记者表示,2024年至2025年的价格战虽加速了AI大模型的市场普及度,但也导致行业普遍陷入“高投入、低回报”的困境。当模型调用量从千亿级跃升至万亿级,算力成本呈指数级放大,单纯依靠资本输血已难以为继。2025年下半年起,部分中小厂商开始悄然收缩免费额度。
“这不是简单的涨价,而是成本结构变化的必然结果。”一位头部云厂商技术负责人向《证券日报》记者分析,“以前行业是用亏损换市场份额,2026年必须考虑可持续经营。”
Token通胀
要理解国产大模型集体涨价,必须先理解“Token通胀”这个概念。
Token是大模型处理文本的最小单位,可以理解为AI的工作量单位。当行业谈论Token通胀时,实际上指的是AI处理任务的复杂度激增,导致同样的服务需要消耗更多的算力资源。就像以前开一盏小灯,现在要开一个工厂,电费自然水涨船高。
这股“通胀”压力首先来自海外市场需求的爆发。2026年2月份,OpenRouter平台(全球主流的大模型API分发平台)数据显示,当月全球前十AI模型的Token总消耗量突破27万亿,其中中国大模型贡献了14万亿,占比超过50%。
“这意味着国产大模型正从内需驱动转向全球输出。”广州艾媒数聚信息咨询股份有限公司CEO张毅在接受《证券日报》记者采访时表示,“海外用户的调用习惯与国内截然不同。”欧美开发者更倾向将大模型嵌入生产级工作流,单次请求往往伴随多轮工具调用、长上下文检索与代码生成,“同样一次API(应用程序编程接口)调用,海外场景的Token消耗可能是国内的三倍到五倍”。
如果说海外市场是外因,那么AI智能体的规模化落地,则是推高算力成本的内因。
与早期聊天机器人时代的单次问答不同,AI智能体具备“感知-决策-执行”的闭环能力,能够自主完成复杂任务。以金融风控场景为例:一个AI智能体完成单笔信贷审批,需经历用户画像检索(长上下文)、征信数据调用(工具使用)、风险评估计算(推理链)、报告生成(输出)四大环节,全程消耗Token量可达数十万级别。
诸多因素相互叠加,数据表现惊人。国联民生证券测算显示,中国整体日均Token消耗从2024年初的1000亿级,飙升至2026年2月份的180万亿级。且随着AI智能体向多模态、多智能体协作演进,这一数字仍在加速膨胀。
供需关系的逆转,最终传导至价格体系。2025年以来,全球AI算力基础设施面临产能荒,受HBM显存(高带宽内存,AI训练的核心部件)、先进制程GPU(图形处理器)供应紧张影响,服务器采购成本同比大幅上升。
比如,3月17日,阿里云发布公告称,因全球AI需求爆发、供应链涨价,阿里云AI算力、存储等产品最高涨价34%。
当大模型厂商从“卖水人”变成“喝水人”,涨价成为维持服务质量的刚性选择。智谱AI在调价公告中直言:“用户规模与调用量快速提升,公司需同步加大算力投入。”
商业模式重构
涨价撕开的不仅是成本缺口,更是整个行业商业逻辑的深层重构。
“价格战结束时,价值战才真正开始。”前述云厂商技术负责人判断,2026年将成为AI大规模商业化应用元年,行业竞争焦点正从单纯拥有算力,转向能否提供高效、稳定、低成本的模型服务与AI应用。
当下,大模型行业正在从“流量补贴”转向“价值筛选”。早期低价策略吸引了大量试错型用户,造成算力资源的低效占用,某厂商曾统计,其免费额度消耗中40%来自无实际业务场景的测试调用。而通过适度涨价,企业既能过滤非刚性需求,又能为优质客户保障服务稳定性。智谱、腾讯云等厂商产品大幅涨价的背后,实则是将价格锚定于企业级客户的支付意愿与ROI(投资回报率)平衡点。这种“以价补量”的精细化运营,标志着中国大模型产业正从互联网式的规模扩张,迈向软件行业的价值定价。
工业和信息化部信息通信经济专家委员会委员盘和林对《证券日报》记者表示,涨价并不会抑制真实需求,反而会加速“良币驱逐劣币”的进程。企业级客户对稳定性、合规性的高要求,使其付费意愿与生命周期价值远超长尾用户,这正是大模型厂商从“流量思维”转向“价值定价”的底气所在。
这种转变,正在重塑整个产业链的利益格局。上游算力厂商(如英伟达)持续受益;中游云厂商(如阿里云、腾讯云)则在卖模型与卖算力之间寻找平衡——既想通过AI服务吸引客户,又不愿被高昂的算力成本拖垮;下游应用层则出现明显分化:具备自研能力的大厂(如字节跳动、百度)可在集团内部灵活调配算力资源,来对冲涨价风险,而纯靠调用API的中小创业公司则面临成本暴涨、被迫关停的困境。
企业级大模型厂商也开始关注Token经济的深层变革。滴普科技股份有限公司联合创始人、执行董事杨磊对《证券日报》记者表示:“未来,Token即产能。随着Skill-based Model(基于技能的模型)重塑软件开发、数据分析、客服外包等行业,传统的单人单天的计价方式必将被‘Token消耗’计价取代。这不仅是计量单位的变更,更是生产力范式的飞跃。”
张毅表示,站在全球竞争视角,Token通胀亦是国产模型技术跃迁的副产品。涨价不是终点,而是新一轮效率革命的起点。谁能在这场算力军备竞赛中持续优化成本结构,谁就能在AI智能体时代的全球牌桌上保留席位。
回望2024年的价格战,再看今日的集体涨价,中国大模型产业正经历痛苦的成人礼。那个依靠骨折价博眼球的时代已然落幕,依靠技术效率、客户价值与生态闭环取胜的新纪元,正在Token经济洪流中徐徐展开。