欧盟新报告深度分析AI in Science竞争现状

360影视 欧美动漫 2025-04-19 18:32 2

摘要:为推进AI在科学中的应用,欧盟开展了科学AI国家政策互学互鉴(Mutual Learning Exercise on National Policies for AI in Science)研究项目,并分别于2025年2月24日和4月15日发布《科学AI基础设

为推进AI在科学中的应用,欧盟开展了科学AI国家政策互学互鉴(Mutual Learning Exercise on National Policies for AI in Science)研究项目,并分别于2025年2月24日和4月15日发布《科学AI基础设施》与《科学AI人才》两份报告,总结了参与该项目国家科学AI的现状与挑战,并提出了政策建议。两份报告的主要内容概述如下。

一、战略背景

在该研究中,科学AI(AI in science)指的是利用AI来改进和加快各学科的研究,涵盖了从个人研究人员使用传统机器学习(ML)技术和大型语言模型(LLM),到能够自行进行实验和分析数据的更先进的系统。

该研究指出,最近的AI进展正在改变材料科学、药物设计、量子物理和医学等领域研究人员的工作方式,使研究更有效,更有能力应对气候变化和流行病等挑战。AI在科学中的根本影响是降低科学研究的经济成本:科学的智力部分现在由人类和AI完成,而实验部分现在由人类和实验室机器人完成。

目前AI由美国和中国的大型科技公司主导,任何一家欧洲公司无法竞争,这是欧洲的一个根本战略关切。

虽然AI的能力尚未被完全理解,但AI显然有潜力大幅提升科研速度和效率。科学是技术的基础,技术是社会的基石。欧洲卫生、经济和军事安全需要具有国际竞争力的技术。

二、科学AI基础设施

第一份报告分析了AI基础设施中的三个主题:高性能计算、科学数据、AI基础设施前沿(基础模型和AI科学家)。

1.高性能计算(HPC)

高性能计算指的是各种大型计算设施,传统超级计算机、基于云的集群、基于图形处理器(GPU)的学习和推理系统等。尽管历史上高性能计算与AI各自独立发展,但GPU硬件的改进推动了两者的融合,进而推动了深度学习的突破。这种融合越来越需要大量的计算和数据资源。

欧盟对高性能计算的主要支持是EuroHPC,它是欧盟、欧洲国家和私人合作伙伴于2018年共同发起的一项倡议,旨在在欧洲建立一个世界级的超级计算生态系统。EuroHPC联合执行体(JU)有两个主要目标:建立泛欧超级计算基础设施,支持高性能计算的研究和创新,总部设在卢森堡市,于2018年11月在欧盟委员会监督下开始运营,并于2020年获得自治权,由成员共同资助,2021-2027年的预算约为70亿欧元。然而与美国和中国相比,EuroHPC的高性能计算能力要小得多。

EuroHPC联合执行体当前的一项重要举措是“AI工厂计划”(AI Factories call),旨在通过整合AI成功的三个关键要素即计算能力、数据和人才创建一个蓬勃发展的欧洲生态系统,用于训练先进的AI模型和开发AI解决方案。“AI工厂”将实现互联互通,并向欧洲AI初创企业、行业和研究人员开放。

该报告指出,在过去的几年里,AI通过ChatGPT等大语言模型(LLM)的发展已经发生了改变。LLM的成功验证了"规模化假说"(scaling hypothesis),即机器学习模型(尤其是神经网络等深度学习模型)的性能会随着其规模、训练数据量和计算资源的增加而呈现可预测的提升。

基于对该假说持续有效的预期,以中美两国科技巨头为主,全球约有万亿美元资金在向新型高性能计算(HPC)领域投入。然而,由于经济、技术和环境的限制,这一假设可能会趋于稳定。如果规模化假设被证伪,那么当前中美科技巨头在AI超算领域的巨额投入,其技术前瞻性或将沦为如同18世纪在斋浦尔建造的简塔·曼塔天文台巨型日晷——当时机械钟表已明确成为计时技术发展方向。在此情境下,AI的未来突破将不得不依赖于更高效的机器学习方法或硬件架构的创新。

该报告希望“规模化假设”不再持续有效,因为一是欧洲无法通过规模化推动AI的强力发展,二是计算基础设施所使用的全球能源份额正在迅速上升,而为扩展AI而构建大量新的高性能计算资源将使这一情况更加恶化。

该报告对发展高性能计算提出如下政策建议:

——加大对高技能计算资源的投入;

——参与AI工厂计划;

——优先开发更小更节能的AI系统;

——研究将欧洲结构和投资基金(ESIF)作为资金来源;

——高性能计算实践必须优先考虑能源效率和可持续性;

——对国家和欧洲一级存在的HPC软件差距和资产进行盘点;

——将AI和高性能计算整合到教育和培训计划中,引入融合AI和高性能计算的跨学科硕士和博士课程,建立正式的培训计划面向研究人员、行业专业人员和私营部门开放,以建立健全人才管道。

——加强泛欧合作,共享基础设施、专业知识和最佳实践,培育合作文化;

——平衡产学研合作。

2.数据

科学AI数据基础设施指的是数据存储库、数据共享平台、模型共享平台等。AI的最新进展不仅得益于高性能计算的利用,也得益于海量数据的获取。数据在科学AI中也同样重要。例如,如果没有对蛋白质序列和结构数据库的开放访问,AlphaFold就不可能实现。

欧洲开放科学云(EOSC)是欧盟推出的促进研究数据共享的重要行动之一,其目标是为欧洲研究人员、创新者、公司和公民提供一个联合和开放的多学科环境,他们可以在其中发布、查找和重用数据、工具和服务,用于研究、创新和教育目的。另外,欧盟还在开发14个部门/领域的通用欧洲数据空间(Common European Data Spaces)。

该报告对推进科学AI数据基础设施也提出了政策建议,包括:

——优先考虑互操作性和跨学科协作,以最大限度地发挥共享数据的价值;

——改进培训并加大对专门支持岗位的资金投入至关重要;

——应该考虑加强对数据共享的激励,并简化流程,建立奖励制度,以认可研究人员对开放数据存储库的贡献。

——欧洲开放科学云应得到扩展和标准化,以充分发货会其潜力;

——AI有潜力从教科书、科学论文和研究成果中提取明确的可执行知识,从而丰富数据基础设施。这一领域的AI研究应该得到支持。

3.基础模型

基础模型是一种基于广泛数据训练的AI模型,因此可以进行调整并应用于广泛的应用程序。基础模型旨在通过允许大型、适应性强的模型从大量数据集中学习,从而彻底改变科学研究。鉴于生物、化学和物理系统的复杂性,这项技术在解决生物学和医学领域的关键挑战方面拥有巨大潜力。

科学基础模型是一种非常有前景的途径,可以为加速科学研究提供基础设施,对社会科学也很有价值,例如通过加强调查研究、在线实验、基于主体的模型和其他通常用于研究人类行为的技术。

该报告认为,需要公共领域的基础模型。而一个值得注意的倡议是万亿参数联盟(Trillion Parameter Consortium):一个新的国际联盟,旨在为科学创建值得信赖和可靠的生成式AI模型。

对推进基础模型发展,该报告提出了如下建议:

——对基础模型的基础设施(高性能计算和数据)的战略投资至关重要,扩展高性能计算和数据基础设施以支持科学基础模型的训练和推理是必要的。

——跨学科合作和有针对性的培训项目将有助于最大限度地发挥基金会模型的效用。需要教育举措来连接AI、高性能计算和各个科学学科,培养一支熟练利用这些先进工具的劳动力队伍。还应鼓励跨机构和国家的合作研究,将基础模型与假设生成和实验验证相结合,推动跨多个研究领域的突破。

——有必要为欧洲科学家提供平等的获得基础模型的渠道。应促进数据和模型的开放共享,确保广泛参与,使各行各业和各地区的研究人员能为AI驱动的科学进步做出贡献。

——需要开发通用的、可信的基础模型,这些模型必须阅读并理解科学文献,理性地比较和整合所有科学文献中相互矛盾的陈述,能够产生有充分根据的新假设和理论,并能够提出最有效的实验来推动科学发展。

——有必要监控并尽量减少影响期刊、审稿人、编辑和科学读者的科学不端行为。应促进健全的制度和对研究过程的独立审计,以发现和防止欺诈或不道德行为,从而维护科学诚信。

5.AI科学家

科学AI最先进的是“AI科学家”(也被称为“机器人科学家”、“自动驾驶实验室”、“自主发现系统”、“机器科学家”等)。这些AI系统与实验室自动化相集成,实现了科学研究的闭环自动化。AI科学家最早起源于欧洲。然而,在对AI科学家的投资方面,欧洲远远落后于美国和加拿大。

2024年4月,欧盟委员会的科学咨询机制(SAM)发布了关于如何促进整个欧盟在研究和创新中采用AI的独立政策建议,其中与AI科学家相关的内容是“建立欧洲分布式AI科学研究所”。该建议指出,“为了对抗少数公司对AI基础设施的主导地位,并赋能跨学科的公共研究,科学家们建议成立一个新的研究所。”欧盟委员会主席冯德莱恩也表达了类似的观点,提议成立“欧洲AI研究理事会”(European AI Research Council)。

其他一些机构如欧洲人工智能研究实验室联合会(CAIRNE)、未来世代中心(CFG)同样有此建议,即成立像欧洲核子研究组织(CERN)的AI研究所(CERN for AI in Science)。

该报告呼吁推动这样的AI研究所成为现实,认为这将使欧洲有可能主导下一次科学技术革命,从而保障欧洲的健康、经济安全和军事安全。

该报告就AI科学家发展同样提出了一些政策建议,包括:

——应考虑为资助一项大规模的科学AI计划,并探讨构建这种计划的最佳方式;

——加强实验室硬件和软件的互操作性对于提高采用率和可用性至关重要,特别是在多学科和协作研究环境中;

——需要有针对性的教育举措、新的学术课程设置以及吸引该领域全球人才的激励措施;

——欧洲应该参与并支持国际努力,以减轻AI在科学中使用的风险;

——需要支持机器人科学,以解决当前在实现更高水平的自动化和增强实验室内执行任务的普遍性方面的挑战。

第一份报告最后指出,欧洲目前在科学AI领域仍具有国际竞争力,但必须迅速采取行动,以保持其竞争优势。

科学AI竞赛是欧洲未来繁荣的核心,目前主导AI的美国和中国的大型科技公司并未在科学领域占据优势,因为科学需要实验室和设备,而大型科技公司只能有限地获得这些实验室和设备。相比之下,欧洲科学界拥有必要的科学专业知识,以及广泛的学术和工业科学实验室和设施网络。这些人才和设备比大型科技公司高出几个数量级。欧洲还有一个优势,那就是拥有大量的实验室自动化产业。

三、科学AI人才

第二份报告从吸引和留住技术人才、提供培训、鼓励跨领域团队合作、构建立公私组织伙伴关系以及改善AI教育等方面进行了分析。

该报告指出,AI工具的日益普及引发了人们的疑问:未来的科学家是否需要深厚的机器学习专业知识,或者AI素养和提示工程是否足以满足许多应用的需求。这种快速转变需要一种适应性强、具有前瞻性的教育方法,以确保研究人员始终具备相关技能。因此,一个关键的政策考量是建立敏捷、响应迅速的教育体系,以持续适应新兴的AI能力和研究需求。

1.科学AI人才的吸引和留住

报告指出,吸引和留住人才对于推进AI在科学领域的应用至关重要。在这种情况下,“人才”包括各种技能组合,包括AI研究;将现有AI工具应用于其他科学领域;研究、软件和数据工程;科学学科的数据管理;以及重要的“横向”能力,如团队合作、沟通和负责任的创新。

随着AI在解决复杂科学问题中发挥越来越大的作用,对能够有效开发和应用AI工具的高技能专家的需求越来越大(从这个意义上说,专家可以是:人工智能/机器学习研究人员、数据科学家、数据工程师、数据管理员、科学软件开发人员、领域科学家等)。

该报告建议为了了营造一个更具支持性和可持续性的AI人才环境,政策制定者应关注以下几点:

——有针对性的AI研究资金,专门支持以AI为重点的职业发展、培训和跨学科研究;

——精简行政程序,减少在招聘和拨款申请方面的官僚延误;

——简化签证政策,促进国际流动,吸引和留住全球AI人才;

——明确的人才留住政策,包括结构化的职业发展、终身职位和激励措施等;

——提高研究人员的工资,以提高他们相对于私营部门的竞争力,并留住和吸引人工智能和科学人才。

2.AI教育与课程融合

报告指出,教育是建立强大的AI科学人才库的基础。为了满足科学研究中对AI专业知识日益增长的需求,将AI教育融入到从小学到大学的课程中至关重要。早期接触AI概念有助于培养兴趣和发展基本技能;此外,这些举措可以鼓励不同人群更广泛地参与,从而有助于克服STEM领域的性别刻板印象。高等大学课程应该让学生掌握跨学科研究所需的专业知识。

关键挑战之一是AI技术的快速发展,要求教育系统更加敏捷和响应迅速。AI课程,特别是在大学和专业培训阶段,必须经常更新,以反映基础模型、生成式AI和伦理考虑等新兴趋势。如果没有持续的课程修订,AI教育可能会过时,导致研究人员和专业人员对现实世界的AI应用毫无准备。

就加强AI教育与课程融合,该报告提出了如下建议:

——将AI和计算思维的主题纳入中小学教育;

——将大学AI教育从计算机科学扩展到各门科学学科;

——开发灵活、模块化的AI课程,让不同背景的学生在各阶段教育都能获得AI技能;

——支持AI终身学习和专业发展,特别是需要将AI融入到工作中的研究人员;

——加强公私伙伴关系,创造实用的AI培训机会,确保研究人员获得AI应用的实践经验;

——鼓励跨大学合作,使学生能够从多个大学学习AI课程。

——鼓励科学家与公众接触,揭开AI的神秘面纱,并促进有关其社会影响的知情讨论;

——通过定期重新评估和更新课程内容,确保教育系统的敏捷性和响应性。这可能包括定期审核AI课程和模块化学习结构,以便快速适应技术进步。

3.培训和技能提升

报告指出,培训和提高技能对于发展和维持一个强大的AI科学人才库至关重要。随着AI技术的快速发展,研究人员和专业人员需要持续的学习机会,以掌握最新的工具和方法。提供便捷有效的培训项目,确保科学家能够以创新的方式应用AI来应对复杂的挑战。

针对培训和技能再提升,该报告提出如下政策建议:

——改革评估标准,在进行研究和教学绩效评估时,承认AI培训工作是有价值的(但非强制性);

——引入培训师培训计划,并与AI专业机构开展教师交流;

——扩大国家人工智能基础设施,以提供计算能力和结构化培训;

——为AI课程提供补助和补贴,类似于奥地利的“数字奥地利”计划,该计划为研究人员的AI培训项目提供资金;

——国家和欧洲研究资助机构应将AI培训成本纳入研究资助。

4.跨学科AI研究和职业发展

报告指出,跨学科研究对于推进AI在科学领域的发展至关重要,因为它可以将AI工具和技术整合到生物学、物理学和环境科学等领域。这种合作有望在解决复杂的科学问题方面取得突破。然而,要实现这一目标,需要刻意努力培育跨学科方法,并创造可持续的职业发展道路,鼓励科学家跨领域参与。同时,必须承认跨学科研究本身就具有挑战性,而且不一定总是成功。

促进跨学科研究的良好举措包括:为汇聚AI专家和领域科学家的项目设立专项资助计划,建立跨学科研究中心,以及提供将AI与科学学科相结合的联合学术项目。职业发展可以通过认可和奖励学术和机构环境中的跨学科工作,提供指导机会,以及提供灵活的职业道路来连接学术界,工业界和公共研究机构来支持。

就跨学科AI研究和职业发展,该报告提出如下政策建议:

——国家研究资助机构应该引入跨学科的AI资助计划;

——资金申请应该明确要求AI研究人员和领域专家之间的合作;

——评估流程应进行调整,以纳入审查小组的跨学科专业知识;

——大学应该在课程中融入AI,以促进跨学科学习;

——AI培训应融入STEM和社会科学学科,以培养跨学科AI素养;

——博士和博士后课程应该从一开始就支持跨学科的AI研究。早期职业研究人员应该与来自AI和领域科学的导师结对;

——制定更清晰的学术和行业路径,鼓励跨领域流动不受处罚;

——AI研究应纳入国家科学战略。政府应确保AI成为国家研究议程的核心组成部分,并促进跨领域合作;

——跨学科项目的评估应考虑到跨领域整合的内在挑战,并容忍失败,特别是在早期阶段。

5.公私伙伴关系和国际合作

报告指出,公私合作和国际合作对于培养和留住科学AI人才至关重要。在科学领域推进AI的挑战,如获取资源、资金和尖端专业知识,需要跨部门和跨国界合作。学术界、产业界和政府之间的合作可以弥合资源缺口,提供实际经验,并为人才发展创造新的机会。同样,国际合作促进了知识交流、利用全球研究基础设施以及汇集人才,以应对复杂的科学挑战。

针对合作伙伴关系建立,该报告提出如下建议:

——政府应积极推动学术机构、私营公司和研究机构之间的结构化合作,以培养AI人才和提升研究能力。这可能包括共同资助的AI研究项目、行业赞助的博士课程,以及由学术界和产业界主导的AI培训项目;

——确保所有学科都能获得公私合作的AI培训项目;

——国家和欧盟层面的研究资助机构应引入明确支持跨境AI研究合作和跨学科AI应用的资助项目,促进AI人才的知识共享和流动;

——政府应投资AI研究基础设施,如高性能计算资源、云平台和开放访问数据集,确保学术和行业研究人员拥有有效合作的必要工具;

——决策者应确保将AI作为国家研究战略的核心组成部分,这需要不同科学学科之间以及公共和私营部门之间的合作。这可能包括建立促进大学和产业界合作的国家人工智能中心;

——税收激励、补贴和资助计划应鼓励私营公司投资与大学的AI研究合作,共同开发培训计划,并为AI研究人员提供行业实习机会;

——AI人才受益于跨部门的多元化经验。政府应该建立流动性计划,允许研究人员跨大学、私营企业和国际研究机构工作,确保跨行业知识转移;

——国家和国际政策应鼓励企业和研究机构共享AI工具、数据集和研究成果,以促进开放科学原则。这将促进更广泛的合作,并加速AI在科学领域的进步;

——政府和大学之间基于绩效的资助协议应包括对AI培训计划的要求,确保高等教育机构优先考虑跨学科的AI技能提升;

——许多AI研究合作目前都与短期项目有关,影响有限。政府和资助机构应鼓励学术界和产业界建立多年的AI合作伙伴关系,为AI研究和劳动力发展提供稳定和持续的投资。

第二份报告最后指出,AI人才是科学进步的战略必需品。政府、研究机构和产业界需要协调一致,建立一个有利于AI人才茁壮成长的生态系统。通过实施上述建议,欧洲国家可以创建一支可持续和有竞争力的AI劳动力队伍,以应对未来的科学挑战。

资料来源:

1.European Commission(2025). Infrastructures for AI in science : mutual learning exercise on national policies for AI in science : second thematic report. https://data.europa.eu/doi/10.2777/8581577

2.European Commission(2025). Talent for AI in science : mutual learning exercise on national policies on AI in science. https://data.europa.eu/doi/10.2777/8779512

[本文为中国教育科学研究院国际教育研究中心承担的教育部高校国别和区域研究2024年课题研究成果]

来源:中国教科院比较所

相关推荐