国家数据局局长刘烈宏今天(24日)介绍,截至2025年年底,全国已建成高质量数据集超过10万个。到今年3月,我国日均Token(词元)调用量超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。
刘烈宏表示,日均Token调用量的大量增加,充分表明中国的人工智能发展进入快速增长阶段,应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力显著增强,也标志着数据集的供给在大量增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
据介绍,下一步,国家数据局将以场景需求为牵引,加快推进先行先试工作,打造技术可行、实用便捷、质量保障的高质量数据集,实现供给的量质提升。
什么是Token?
在AI的世界里,Token是模型处理信息的最小计量单位,无论是用户的提问,还是AI生成的一段代码,最终都要被拆解成Token来完成运算。正因如此,Token调用量成为衡量AI模型活跃度和产业价值的关键指标,Token调用量越高,意味模型被用得越多,创造的实际价值也就越大。
来源:新闻联播