日均调用量两年激增千倍 词元成我国AI产业新驱动逻辑
2026-05-08 05:05      作者:谭伦     来源:中国经营网

中经记者 谭伦 福州报道

2026年尚未过半,但Token(词元)引发的热潮,正在定义一个新的产业元年。

在日前举行的数字中国建设峰会上,国家数据局局长刘烈宏表示,进入智能经济时代,词元正在成为交易的计量单位,到今年3月,我国日均Token(词元)调用量已超过140万亿,相比2024年年初,两年增长量超千倍,折射出人工智能产业价值逻辑正在从流量驱动转向词元驱动。

与此同时,本次大会同期发布的《全国数据资源调查报告(2025年)》显示,2025年,我国用于人工智能训练和推理的数据总量达199.48艾字节(EB),其中推理数据量101.34EB,首次超过训练数据量。此外,中国信通院最新发布的研判显示,我国公有云大模型(对客侧)调用量在2025年将达到2000万亿,较2024年增长超过16倍。

这意味着,每一次调用模型、每一次生成文本、每一次让智能体执行任务,本质上都在消耗词元,词元增长,也意味着算力、数据、模型、平台和应用正在形成一个新的产业闭环。在此背景下,刘烈宏指出,随着2026年以智能体为代表的人工智能应用加速落地,以词元为基础的价值体系和商业服务模式,正在实践中不断探索成型。


从“调用量”到“结算单位”

公开信息显示,作为AI大模型处理信息的最小单元,同时也是AI模型使用的最小结算单位,Token类似于语言沟通中的单词、字符。2026年3月,全国科学技术名词审定委员会发布公告,推荐将“词元”作为人工智能领域“Token”的标准中文名。

而回溯词元的诞生历程,其与AI大模型发展紧密相关。2023年,随着国内大模型初生,训练侧的参数性能迅速成为关注焦点,谁拥有更大的参数规模、更多的GPU、更强的通用能力,谁就更容易获得“领先”的标签。但从2024年开始,行业重心悄然变化。

国家数据局发布的数据显示,2024年年初,我国日均Token消耗量约1000亿;而到了2025年6月底,则已突破30万亿;2025年年末,该数据升至100万亿;2026年3月,又再度越过140万亿,短短两年间,增长超过千倍。值得注意的是,到了2025年,用于AI训练和推理的数据中,推理数据量已经超过训练数据量。

这一增长背后,也对应着我国AI应用需求的变化。从早期应用更多是聊天、问答、写作、检索等轻量场景,发展到2025年的“推理和应用”阶段。对此,中国信通院发布的报告指出,随着DeepSeek等模型走红,国内MaaS平台加速通过动态资源调度、推理引擎优化等工程能力提升服务稳定性和可靠性,国内11个MaaS平台上DeepSeek-R1服务的平均调用成功率、每秒输出Token数和首Token时延都在持续改善。这表明,产业进程由此从“能用”走向“好用”,也从“试点示范”走向“规模化应用”。 

这一变化,也使得词元在产业链层面逐步成型。从高性能算力和算力网络,到模型平台、推理引擎、MaaS与Agent平台,再到行业应用、数据服务和结算体系,我国都在快速诞生代表性的企业。

其中,最具代表性的进展之一来自互联网和云平台巨头。以阿里巴巴为例,其已宣布将AI相关业务整合进新的Alibaba Token Hub(ATH)事业群,由阿里巴巴集团CEO吴泳铭直接掌舵,目标是把通义实验室、MaaS、千问、悟空等能力统一到AI工作平台中。阿里公开文件还提到,其在应用层用Token驱动“悟空”等企业级AI原生智能体,推动AI从“会思考的聊天机器人”走向“会执行的数字伙伴”。

此外,字节跳动旗下的火山引擎也将自身定位为聚焦豆包大模型和AI云原生技术的云与AI服务平台,强调为企业提供从Agent开发到部署的一站式服务。


AI计费催生新逻辑

除了互联网云巨头,词元产业链的另一代表来自通信运营商。继今年年初宣布正式向Token经营转型后,在本届数字中国建设峰会期间,中国电信发布了一站式Token服务平台,并宣布成立Token生态联盟。据悉,该平台被定位为覆盖Token规模生产、调度分发、价值变现全链条的服务体系。

中国电信董事长柯瑞文提出,Token经营的本质就是为用户提供AI服务。与此同时,中国电信方面还强调,将深化智能云体系建设,推动企业战略由“云改数转”迈向“云改数转智惠”。 

通信分析师周桂军认为,这意味着,运营商正在尝试把过去的云、网、算能力整合为新的智能服务底座。而互联网巨头和运营商的动作都显示,未来AI能力不再只是“卖软件和模型能力”,而是开始“卖调用效率、卖平台服务、卖智能体工作流”。

在周桂军看来,这一方向也解释了,词元之所以会成为产业主逻辑,最直接的原因是AI商业模式正在从“训练一次、长期复用”转变为“持续调用、持续付费”。与过去的软件许可模式不同,AI的核心成本发生在推理环节,而推理的计费单位就是词元。

Gartner在2026年3月的最新预测中指出,到2030年,对超大参数LLM进行推理的成本将比2025年下降90%以上。同时,中国信通院也在《大模型推理优化关键技术及应用实践研究报告》中系统梳理推理优化、MoE开发平台、工程落地等路径,种种迹象显示,行业共识已十分明确:未来AI竞争不只是参数和训练,更是推理效率与单位词元成本的竞争。 

值得注意的是,在词元成为AI计费的背景下,“成本下降”也成为2026年国内AI行业的热点议题。DeepSeek及其他国产模型在近期多次调价,进一步把百万词元的推理费用压低到行业的较低水平。对此,柯瑞文公开表示,最新发布的DeepSeek-V4及其他模型大幅降低推理词元的消耗量,国产算力性能和算力资源调度能力持续增强,进一步减少了词元生产成本。对企业而言,这意味着AI不再只是“有预算的大厂项目”,而开始变成可嵌入的流程、可按效果付费、可规模化部署的基础设施。企业对AI投入意愿提升,商业闭环才真正有了可持续的基础。

记者注意到,截至目前,国内AI头部玩家已经开始围绕词元重新定义自身角色。其中,中国电信试图将自己从传统通信运营商升级为“AI服务商”;阿里巴巴则把Token Hub作为集团AI中枢;火山引擎强调从Agent开发到部署的一站式能力;硅基流动甚至把自己定义为“Token工厂”,试图重构AI服务的价值产出与分配模式。

业内广泛认为,此番巨头战略调整的共同点在于,都不再满足于只提供单一模型或单点算力,而是要将词元变成可以被规模化经营的“新流水”,围绕词元的调用、分发与结算,生成一套新的价值体系。


智能经济开启新周期

随着词元在AI价值链中地位凸显,AI从“技术红利”变成“产业红利”的前景也在进一步明朗。

据IDC预计,2025年中国AI相关IT支出约为380亿美元,此后将保持25%以上的年复合增长率。与此同时,政策层面也在持续推进“人工智能+”和数据要素市场化价值化。在此背景下,AI不再只是少数企业参与的前沿技术,而词元正在成为几乎所有行业的生产要素。 

更重要的是,中国信通院指出,业界已公开发布的MaaS平台超过100个,国内大模型服务正通过推理引擎优化、动态调度和平台化服务提升稳定性;Gartner则预测推理成本到2030年将大幅下降。若这一趋势持续,我国在模型开源、工程优化、算力调度和行业数据上的综合优势,可能会进一步转化为“更低成本、更高频次、更深场景”的落地能力。

但挑战同样明显。首先是成本与效率的再平衡。Token消耗越大,算力、电力、存储和网络压力越大,企业支出成本陡升。对此,Gartner提醒,Token成本、模型托管和推理费用会在规模化时迅速吞噬预算。

在此次峰会上,刘烈宏也强调,每一次智能推理和词元生成背后,需要巨量的算力资源投入,这意味着基础设施既要建好网络保持连接能力,更要把算力布好、管好、用好,实现算力资源的精准计量和高效调度。

同时,刘烈宏指出,当前词元价格虽然有竞争力,但也必须清醒地认识到如果长期靠低毛利运行,产业链没有合理的利润,创新很难持续。因此,在AI词元时代,不能简单复制“低价抢市场、补贴换规模”的流量时代传统打法。

对此,刘烈宏表示,今年,数据基础设施和全国一体化算力网建设纳入国家“十五五”规划109项重大工程项目,下一步将制定实施国家数据基础设施建设五年行动计划,因地制宜、稳中求进,推动国家数据基础设施的建设和运营,深入实施“东数西算”工程,加快构建全国一体化算力网,大力开展算电协同,构建多层次的算力设施体系。未来将积极探索词元的市场化定价与结算机制,让价格信号真实反映算力成本与服务质量,促使创新的中心回到提升模型效率、降低推理成本、解决实际问题上,形成技术迭代、成本下降、应用扩大的良性循环,实现人工智能的普惠和可持续发展。

毫无疑问,140万亿日均词元消耗量,不是一个峰值,而是成为中国AI产业进入新阶段的一个开始。随着算力厂商、云平台、运营商、数据服务商、行业软件商和应用企业的共同参与,词元正在驱动我国进入智能经济的新纪元。

(编辑:张靖超 审核:李正豪 校对:颜京宁)