摘要:2025年4月,斯坦福大学发布《2025年人工智能指数报告政策摘要》(Atificial Intellgence Index Report 2025,Policy Highlingts),报告全面分析了全球人工智能领域的最新发展趋势,涵盖技术性能、行业投资、国
以下是针对政策制定者及其他政策相关受众的人工智能指数报告关键摘要。完整报告可在hai.stanford.edu/ai-index/2025-ai-index-report查阅。
01 公共部门在尖端人工智能发展上仍落后于行业,计算需求持续飙升
行业在人工智能领域持续投入巨资,并在重要模型开发中保持领先地位。2024年,近90%的重要模型来自行业,而2023年这一比例为60%(见图1)。
图1:2003-2024年各领域重要人工智能模型数量
尽管全球公共部门对人工智能的投资显著增加(2023年以美国的8.31亿美元公共支出为首)(见图2),且学术界在过去三年中仍是高引用(前100名)人工智能出版物的主要生产者,但行业的领先地位依然稳固。
图2:2023年部分国家人工智能相关公共合同支出(单位:百万美元)
大规模行业投资持续推动模型规模和性能提升,人工智能模型对计算能力和能源的需求也在不断增加(见图3):重要人工智能模型的训练计算量大约每五个月翻一番,大语言模型(LLM)的训练数据集规模每八个月翻一番,训练所需的电力每年都在增加。
图3:2012-2024年各领域重要人工智能模型的训练计算量(对数尺度)
02 显著的技术性能提升伴随着标准化评估方法的缺失
人工智能模型的性能在尖端领域趋于接近。随着越来越多的开发者推出高质量模型,人工智能领域的竞争日益激烈。例如,过去一年中,Chatbot Arena排行榜上第一名与第十名模型之间的差距从11.9%缩小至5.4%(见图4)。
图4:Chatbot Arena排行榜上领先模型的性能(按提供商分类)
特别是,开源权重模型正在迎头赶上。截至2025年2月,Chatbot Arena排行榜上领先的开源权重模型与闭源权重模型之间的性能差距已缩小至1.70%(见图5)。
图5:Chatbot Arena排行榜上闭源与开源模型的性能对比
人工智能在新基准测试中的表现提升速度前所未有。2023年至2024年,人工智能在测试极限能力的基准测试(如MMMU、GPQA、SWE-bench)中的性能显著提升,增幅从19%到67%不等。这促使研究人员不断提出更具挑战性的基准测试(如“人类的终极考试”“前沿数学”“BigCodeBench”)。
然而,研究表明许多基准测试设计不佳,凸显了标准化评估的必要性,以确保可靠的人工智能评估并避免对模型性能的误导性结论(见图6)。使用负责任的人工智能标准评估系统仍不常见,旨在评估模型事实性和真实性的基准测试也未能得到广泛采用。
图6:部分基准测试的设计与可用性评分对比
03 美国在人工智能发展的许多方面仍保持领先,但与特定国家的竞争日益激烈
美国在重要人工智能模型数量(2024年40个,见图7)、高引用(前100名)人工智能出版物数量(2021-2023年173篇)以及私人人工智能投资(2024年1090亿美元)方面继续领先于特定国家和欧洲。
图7:2003-2024年部分地区重要人工智能模型数量
然而,特定国家与美国在重要基准测试上的性能差距已大幅缩小(到2024年底普遍不到10个百分点,见图8)。特定国家在人工智能研究出版物总量上领先,占全球人工智能出版物的23.2%和全球人工智能研究引用的22.6%。
图8:美国与特定国家领先模型在部分基准测试上的性能对比
尽管北美在组织使用人工智能方面保持领先,但其他地区正在迎头赶上。大中华区的组织人工智能使用率同比增长显著,增幅达27个百分点,紧随其后的是欧洲,增幅为23个百分点(见图9)。
图9:2023年与2024年全球组织人工智能使用率对比
04 随着人工智能的经济机遇显现、事件增加及公众不信任加剧,各国政府正通过监管和投资加强人工智能治理
人工智能开始在业务职能中产生财务影响,持续提升生产力并弥补技能差距。近期研究证实,人工智能对生产力有积极影响,并有助于缩小技能差距。企业报告称,在服务运营、供应链管理和软件工程等领域实现了成本节约,尽管大多数企业仍处于早期采用阶段(见图10)。
图10:2024年生成式人工智能在各职能中的成本降低与收入增长
各国政府正在大规模投资人工智能基础设施。例如,加拿大宣布了一项24亿美元的人工智能基础设施计划,而中国则启动了475亿美元的基金以促进半导体生产。
在美国,2024年引入的联邦人工智能相关法规数量翻了一番;42个机构提出了59项人工智能相关法规。由于联邦层面进展缓慢,各州在人工智能立法方面处于领先地位(见图11):2024年,州级人工智能相关法律通过数量较2023年翻了一番,而联邦层面的提案数量仅增长29.2%。
图11:2016-2024年美国各州通过的人工智能相关法案数量
这些政策行动的背景是人工智能相关事件的持续增加(见图12)以及全球公众对人工智能公司保护个人信息和人工智能系统无偏见的信心显著下降。
研究所简介
国际技术经济研究所(IITE)成立于1985年11月,是隶属于国务院发展研究中心的非营利性研究机构,主要职能是研究我国经济、科技社会发展中的重大政策性、战略性、前瞻性问题,跟踪和分析世界科技、经济发展态势,为中央和有关部委提供决策咨询服务。“全球技术地图”为国际技术经济研究所官方微信账号,致力于向公众传递前沿技术资讯和科技创新洞见。
地址:北京市海淀区小南庄20号楼A座
_er
来源:全球技术地图