零时差丨两年增长一千倍,中国词元调用量有几个底座?


来源:人民日报客户端

根据全球大模型聚合平台OpenRouter发布的排行榜,本周(3月30日至4月4日),国产大模型调用量,已连续一个月碾压海外模型。前10名中,前6席都是国产模型,总调用量达12.27T。这不是昙花一现,而是持续霸榜。

说到这儿,先科普一个新近走进大众视野的科技术语——“词元”(Token)。它是大模型处理信息的最小信息单元,可计量、可定价、可交易。每一个汉字的输入、每一段代码的生成、每一幅图像的识别,背后都在消耗词元。

如果说,工业时代看石油,互联网时代看流量,AI时代就看词元调用量,它是人工智能产业发展的“晴雨表”。

今年3月,中国日均词元调用量突破140万亿,相当于250个中国国家图书馆的全部资源在一天内被调用、被处理、被生成。更令人不可思议的是它上升的速度:相比2024年初的1000亿,这是千倍增长啊,而且只用了两年多时间!毫无疑问,中国已成为全球人工智能应用活跃度最高的国家之一。

那么,是什么支撑起了这条抖得离谱的上升曲线?三个硬核底座,缺一不可。

一是电力“底座”。人工智能的尽头是电力。中国拥有世界最庞大、最先进的电力供应体系,全国累计发电装机容量39.5亿千瓦,清洁能源装机规模持续扩大。把“瓦特”高效转化为“词元”,没电全是白扯。

二是算力“成色”。算力越强,词元处理速度越快、单位成本越低;算法越优,生成内容质量越高、词元调用频次越高。“东数西算”“算电协同”,搭建起完善的算力网络。科技企业在推理芯片、模型架构等方面的持续突破,意味着中国的大模型不仅能跑,还能跑得更便宜、更聪明。

三是应用“土壤”。词元,连接技术供给与现实需求。无论是金融风控、跨境电商运营,还是短视频生成,词元正化作实实在在的生产力。日均百万亿级调用量的背后,是成千上万个高频次、规模化、可持续的商业应用,构建起“数据供给—价值释放”的良性循环。

有媒体分析指出,中国正在构建一种“词元经济”优势,从能源、算力到模型、产出,对整个价值链进行布局。

从“词元经济”看中国人工智能的竞争力,不难发现,这不是一时的“拼量级”,而在于久久为功的长期主义。从提出到2027年推动3—5个通用大模型在制造业深度应用、推出1000个高水平工业智能体等目标,到“十五五”规划纲要明确提出全面实施“人工智能+”行动、全方位赋能千行百业,到《政府工作报告》提出“打造智能经济新形态”“推动重点行业领域人工智能商业化规模化应用”……这是一整套战略布局、接续发力,勾勒出中国人工智能发展的广阔前景。

一个共识日益清晰:中国开源正在成为塑造全球人工智能技术栈的重要。DeepSeek等大模型向世界开源,助力非洲铺就“信息高速公路”,为东南亚工厂提供工业视觉检测等方案……从模型开源到能力共享,“众人拾柴”的模式,既加速中国人工智能产业的迭代进化,更赋能全球创新生态,推动技术普惠。

在这场面向未来的长跑中,中国没有关起门来自己玩,而是追求以人为本、智能向善、公平普惠、协同共治……智能时代的中国答卷,落笔在每一个澎湃跳动的词元里。

可以相信,千倍增长,只是序章。


评论列表 0

暂无评论