《全国数据资源调查报告(2025年)》在第九届数字中国建设峰会上如约而至。翻开这份沉甸甸的报告,在满篇数据图表中,有三组数据特别亮眼,突出反映了我国数据要素化和人工智能发展取得的巨大进步。
52.26ZB VS 90%—企业成为数据生产的主力
报告显示:“2025年全国数据生产总量达52.26ZB,同比增长27.28%”“数据生产增量约九成来自企业数据”。
数据分析:相较于2024年41.06ZB的全国数据生产总量,2025年增长了11.2ZB,其中,企业数据生产量增长近10ZB。表明企业已成为数据生产的主力。
背后原因:企业大规模生产数据的背后,是过去一年来我国数据赋能千行百业和企业数智化转型取得重大进展的必然结果:
一是企业数据生产能力大幅提高。服务业、工业和农业的数据生产量分别为22.85ZB、8.53ZB和1.49ZB,占企业数据生产总量比例分别为68.13%、25.43%和4.44%。一方面表明数智化转型已在各行各业全面展开并加速推进,另一方面也表明各行各业的数智化发展水平不一,服务业的数智化程度最高,工业数智化程度次之,最后是农业数智化。
二是企业数智化转型速度明显提升。数据开发率是直接反映各行业数据开发利用程度的指标,数据开发率越高,表明数据治理加工、挖掘分析、融合应用的能力越强。国民经济行业大类中,软件和信息技术、科学技术、金融、制造、交通运输等5个行业数据开发率超30%,分别为34.36%、32.88%、32.61%、32.21%和31%,跨行业、跨领域数据融合应用不断深入。采矿、水电燃气、居民服务、批发零售业和教育等行业数据开发率紧随其后,分别为27.71%、22.7%、17.52%、16.35%和15.44%,数智化场景密集落地。住宿和餐饮、卫生和社会工作、农业、文体娱业、房地产、建筑业、水利环境公共设施业、租赁和商务服务等行业数据开发率低于15%,需求牵引作用日益凸显。
30% VS 31.71% VS 53.96%——公共数据资源开发利用成绩斐然
报告显示:“2025年全国一体化政务数据共享枢纽累计支撑调用超5500亿次,申请共享的数据集数量同比增长近30%”“全国公共数据开放数据量同比增长31.71%”“全国公共数据授权运营数据量同比增长53.96%”。
数据分析:相较于2024年全国一体化政务数据共享枢纽累计支撑调用超5400亿次,2025年已超5500亿次,对数据集的共享需求快速提升;2024年全国地市级以上开放数据量增长7.1%,2025年全国公共数据开放数据量爆发性增长31.71%;2024年公共数据授权运营刚刚起步,市级政府部门公共数据授权运营数据量是省级部门的2.53倍。2025年全国公共数据授权运营数据量同比增长53.96%,省级公共数据授权运营数据量同比增长54.17%。
背后原因:共享、开放和授权运营是公共数据开发利用的三种主要途径。2025年三种途径都出现了30%以上的爆发性增长,是制度供给端和市场需求端双向发力、相向而行的必然结果:
一是充沛的制度供给极大激发了公共数据供数动力。国家公共数据资源开发利用“1+3”政策文件的落地实施,《政务数据共享条例》《政务领域人工智能大模型部署应用指引》等政策法规出台,以及公共数据资源登记工作稳步推进等,在公共数据安全流通、产权、定价、交易等方面提供了实践指引,并支持鼓励政务领域推广使用政务大模型和智能体,极大激发了公共数据的供数动力,让更多的公共数据以共享、开放、授权运营等多种方式供出来。
二是繁荣的应用市场极大释放了公共数据用数活力。越来越多的金融、交通、医疗和教育机构利用公共数据开展业务。2025年,大多数银行、保险等金融机构充分利用社保、公安、工商、税务、海关等部门的公共数据,为个人和企业画像,构建用于银行、保险业务的个人和企业风控模型,极大提高业务的精准率。许多城市的公交公司通过整合公交车的实时GPS位置、站点客流刷卡数据、路况拥堵等公共数据,不仅可以向市民提供精准的到站时间预测,有效减少市民平均候车时间,还可以根据这些数据动态调整发车班次,降低车辆空驶率,实现智能调度公交和精准预测。许多城市基层疾病预防机构通过汇聚区域内医院的电子病历、社区卫生中心的慢病档案以及疾控中心的传染病报告数据,并融合就诊症状分析、药品销售等数据,自动挖掘异常聚集性病例,实现传染病早期预警,并指导医疗资源的精准投放。许多地方的教育管理部门通过综合运用公安部门的适龄儿童户籍数据、不动产登记中心的房产交易与居住信息,以及学校的教室和师资等承载能力,开展入学需求预警,不仅能辅助教育部门提前预警学位缺口、规划新校建设,同时为家长提供透明的入学风险参考。
199.48EB VS 101.34EB——人工智能应用到了奇点时刻
报告显示:“2025年,用于人工智能的数据量为199.48EB,同比增长42.86%,推理数据量达101.34EB,首超训练数据量。”
数据分析:相比于2024年企业用于人工智能的数据量占数据存储量约为7%,高质量数据集增速达27.4%,2025年用于人工智能的数据增长率达42.86%,高质量数据集数量及其数据量分别增长61.13%和142.58%,特别是推理数据量达101.34EB,首次超过训练数据量,表明我国人工智能发展迅猛,标志着我国人工智能正在跨越从技术突破到规模应用的奇点,人工智能在各行各业的应用正在大规模展开。
背后原因:我国人工智能正在跨越从技术突破到规模应用的奇点的背后,是全社会人工智能应用程度普遍提高、高质量数据集供给规模显著增大、企业数据技术投入持续加大、智能计算的数据生产能力大幅提升的必然结果。
一是全社会人工智能应用程度普遍提高。2025年,全国日均词元(Token)调用量从年初的超万亿增长到年末的100万亿,全年词元(Token)调用量约21100万亿。农业企业数据技术投入同比增长26%,用于人工智能的数据量同比增长14.51%。用于人工智能训练分析的科学数据占数据总量的13.43%,同比增长50.32%。
二是高质量数据集供给规模显著增大。2024年,高质量数据集增速达27.4%,企业用于人工智能的数据量占数据存储量约为7%。2025年,全国高质量数据集数量超11万个,高质量数据集数据量超908PB,同比分别增长61.13%和142.58%。高质量数据集的规模化供给为人工智能发展奠定了坚实数据底座。
三是企业数据技术投入持续加大。2025年,企业数据技术投入同比增长17.37%,其中,头部平台企业和中央企业数据技术投入分别增长25.79%和24.49%。
四是智能计算的数据生产能力大幅提升。2024年,智能家居、智能网联汽车等智能设备的数据增速位居前列,分别为51.43%和29.28%。2025年,系统软件和人工智能产生的数据量为26.92ZB,首次超过物联感知设施产生的25.34ZB数据量,成为数据生产的主要方式。
可以预计,在未来“十五五”的五年内,企业作为数据生产主力的地位将进一步巩固,更大规模的公共数据将以共享、开放和授权运营的方式供出来、用起来,人工智能技术还将快速迭代、应用范围将加速拓展。
作者:数据专家咨询委员会委员 北京交通大学教授 张向宏
来源:通信产业网