贝果

日均调用量两年激增千倍词元成我国AI产业新驱动逻辑

2026-05-08 05:05 作者：谭伦来源：中国经营网

中经记者谭伦福州报道

2026年尚未过半，但Token（词元）引发的热潮，正在定义一个新的产业元年。

在日前举行的数字中国建设峰会上，国家数据局局长刘烈宏表示，进入智能经济时代，词元正在成为交易的计量单位，到今年3月，我国日均Token（词元）调用量已超过140万亿，相比2024年年初，两年增长量超千倍，折射出人工智能产业价值逻辑正在从流量驱动转向词元驱动。

与此同时，本次大会同期发布的《全国数据资源调查报告（2025年）》显示，2025年，我国用于人工智能训练和推理的数据总量达199.48艾字节（EB），其中推理数据量101.34EB，首次超过训练数据量。此外，中国信通院最新发布的研判显示，我国公有云大模型（对客侧）调用量在2025年将达到2000万亿，较2024年增长超过16倍。

这意味着，每一次调用模型、每一次生成文本、每一次让智能体执行任务，本质上都在消耗词元，词元增长，也意味着算力、数据、模型、平台和应用正在形成一个新的产业闭环。在此背景下，刘烈宏指出，随着2026年以智能体为代表的人工智能应用加速落地，以词元为基础的价值体系和商业服务模式，正在实践中不断探索成型。

从“调用量”到“结算单位”

公开信息显示，作为AI大模型处理信息的最小单元，同时也是AI模型使用的最小结算单位，Token类似于语言沟通中的单词、字符。2026年3月，全国科学技术名词审定委员会发布公告，推荐将“词元”作为人工智能领域“Token”的标准中文名。

而回溯词元的诞生历程，其与AI大模型发展紧密相关。2023年，随着国内大模型初生，训练侧的参数性能迅速成为关注焦点，谁拥有更大的参数规模、更多的GPU、更强的通用能力，谁就更容易获得“领先”的标签。但从2024年开始，行业重心悄然变化。

国家数据局发布的数据显示，2024年年初，我国日均Token消耗量约1000亿；而到了2025年6月底，则已突破30万亿；2025年年末，该数据升至100万亿；2026年3月，又再度越过140万亿，短短两年间，增长超过千倍。值得注意的是，到了2025年，用于AI训练和推理的数据中，推理数据量已经超过训练数据量。

这一增长背后，也对应着我国AI应用需求的变化。从早期应用更多是聊天、问答、写作、检索等轻量场景，发展到2025年的“推理和应用”阶段。对此，中国信通院发布的报告指出，随着DeepSeek等模型走红，国内MaaS平台加速通过动态资源调度、推理引擎优化等工程能力提升服务稳定性和可靠性，国内11个MaaS平台上DeepSeek-R1服务的平均调用成功率、每秒输出Token数和首Token时延都在持续改善。这表明，产业进程由此从“能用”走向“好用”，也从“试点示范”走向“规模化应用”。

这一变化，也使得词元在产业链层面逐步成型。从高性能算力和算力网络，到模型平台、推理引擎、MaaS与Agent平台，再到行业应用、数据服务和结算体系，我国都在快速诞生代表性的企业。

其中，最具代表性的进展之一来自互联网和云平台巨头。以阿里巴巴为例，其已宣布将AI相关业务整合进新的Alibaba Token Hub（ATH）事业群，由阿里巴巴集团CEO吴泳铭直接掌舵，目标是把通义实验室、MaaS、千问、悟空等能力统一到AI工作平台中。阿里公开文件还提到，其在应用层用Token驱动“悟空”等企业级AI原生智能体，推动AI从“会思考的聊天机器人”走向“会执行的数字伙伴”。

此外，字节跳动旗下的火山引擎也将自身定位为聚焦豆包大模型和AI云原生技术的云与AI服务平台，强调为企业提供从Agent开发到部署的一站式服务。

AI计费催生新逻辑

除了互联网云巨头，词元产业链的另一代表来自通信运营商。继今年年初宣布正式向Token经营转型后，在本届数字中国建设峰会期间，中国电信发布了一站式Token服务平台，并宣布成立Token生态联盟。据悉，该平台被定位为覆盖Token规模生产、调度分发、价值变现全链条的服务体系。

中国电信董事长柯瑞文提出，Token经营的本质就是为用户提供AI服务。与此同时，中国电信方面还强调，将深化智能云体系建设，推动企业战略由“云改数转”迈向“云改数转智惠”。

通信分析师周桂军认为，这意味着，运营商正在尝试把过去的云、网、算能力整合为新的智能服务底座。而互联网巨头和运营商的动作都显示，未来AI能力不再只是“卖软件和模型能力”，而是开始“卖调用效率、卖平台服务、卖智能体工作流”。

在周桂军看来，这一方向也解释了，词元之所以会成为产业主逻辑，最直接的原因是AI商业模式正在从“训练一次、长期复用”转变为“持续调用、持续付费”。与过去的软件许可模式不同，AI的核心成本发生在推理环节，而推理的计费单位就是词元。

Gartner在2026年3月的最新预测中指出，到2030年，对超大参数LLM进行推理的成本将比2025年下降90%以上。同时，中国信通院也在《大模型推理优化关键技术及应用实践研究报告》中系统梳理推理优化、MoE开发平台、工程落地等路径，种种迹象显示，行业共识已十分明确：未来AI竞争不只是参数和训练，更是推理效率与单位词元成本的竞争。

值得注意的是，在词元成为AI计费的背景下，“成本下降”也成为2026年国内AI行业的热点议题。DeepSeek及其他国产模型在近期多次调价，进一步把百万词元的推理费用压低到行业的较低水平。对此，柯瑞文公开表示，最新发布的DeepSeek-V4及其他模型大幅降低推理词元的消耗量，国产算力性能和算力资源调度能力持续增强，进一步减少了词元生产成本。对企业而言，这意味着AI不再只是“有预算的大厂项目”，而开始变成可嵌入的流程、可按效果付费、可规模化部署的基础设施。企业对AI投入意愿提升，商业闭环才真正有了可持续的基础。

记者注意到，截至目前，国内AI头部玩家已经开始围绕词元重新定义自身角色。其中，中国电信试图将自己从传统通信运营商升级为“AI服务商”；阿里巴巴则把Token Hub作为集团AI中枢；火山引擎强调从Agent开发到部署的一站式能力；硅基流动甚至把自己定义为“Token工厂”，试图重构AI服务的价值产出与分配模式。

业内广泛认为，此番巨头战略调整的共同点在于，都不再满足于只提供单一模型或单点算力，而是要将词元变成可以被规模化经营的“新流水”，围绕词元的调用、分发与结算，生成一套新的价值体系。

智能经济开启新周期

随着词元在AI价值链中地位凸显，AI从“技术红利”变成“产业红利”的前景也在进一步明朗。

据IDC预计，2025年中国AI相关IT支出约为380亿美元，此后将保持25%以上的年复合增长率。与此同时，政策层面也在持续推进“人工智能+”和数据要素市场化价值化。在此背景下，AI不再只是少数企业参与的前沿技术，而词元正在成为几乎所有行业的生产要素。

更重要的是，中国信通院指出，业界已公开发布的MaaS平台超过100个，国内大模型服务正通过推理引擎优化、动态调度和平台化服务提升稳定性；Gartner则预测推理成本到2030年将大幅下降。若这一趋势持续，我国在模型开源、工程优化、算力调度和行业数据上的综合优势，可能会进一步转化为“更低成本、更高频次、更深场景”的落地能力。

但挑战同样明显。首先是成本与效率的再平衡。Token消耗越大，算力、电力、存储和网络压力越大，企业支出成本陡升。对此，Gartner提醒，Token成本、模型托管和推理费用会在规模化时迅速吞噬预算。

在此次峰会上，刘烈宏也强调，每一次智能推理和词元生成背后，需要巨量的算力资源投入，这意味着基础设施既要建好网络保持连接能力，更要把算力布好、管好、用好，实现算力资源的精准计量和高效调度。

同时，刘烈宏指出，当前词元价格虽然有竞争力，但也必须清醒地认识到如果长期靠低毛利运行，产业链没有合理的利润，创新很难持续。因此，在AI词元时代，不能简单复制“低价抢市场、补贴换规模”的流量时代传统打法。

对此，刘烈宏表示，今年，数据基础设施和全国一体化算力网建设纳入国家“十五五”规划109项重大工程项目，下一步将制定实施国家数据基础设施建设五年行动计划，因地制宜、稳中求进，推动国家数据基础设施的建设和运营，深入实施“东数西算”工程，加快构建全国一体化算力网，大力开展算电协同，构建多层次的算力设施体系。未来将积极探索词元的市场化定价与结算机制，让价格信号真实反映算力成本与服务质量，促使创新的中心回到提升模型效率、降低推理成本、解决实际问题上，形成技术迭代、成本下降、应用扩大的良性循环，实现人工智能的普惠和可持续发展。

毫无疑问，140万亿日均词元消耗量，不是一个峰值，而是成为中国AI产业进入新阶段的一个开始。随着算力厂商、云平台、运营商、数据服务商、行业软件商和应用企业的共同参与，词元正在驱动我国进入智能经济的新纪元。

（编辑：张靖超审核：李正豪校对：颜京宁）