使用新的开源跨学科数据集训练AI人工智能模型像科学家那样思考

摘要:弹性惯性湍流(EIT,Elasto-inertial turbulence)是最近发现的一种在稀聚合物溶液中观察到的二维混沌流态。二维直接数值模拟显示了(最多)四个共存的吸引子:层态(LAM,laminar)、稳态箭头状态(SAR,steady arrowhe

原创 Flatiron研究所 zzllrr小乐Polymathic AI(博学人工智能)团队近期发布了两个海量数据集(多模态宇宙、Well),用于训练AI人工智能模型来解决跨科学学科的问题。这些数据集包括来自天体物理学、生物学、流体动力学、声学和化学等数十个来源的数据。作者:Thomas Sumner 2024-12-2译者:zzllrr小乐(数学科普公众号)2024-12-7弹性惯性湍流(EIT,Elasto-inertial turbulence)是最近发现的一种在稀聚合物溶液中观察到的二维混沌流态。二维直接数值模拟显示了(最多)四个共存的吸引子:层态(LAM,laminar)、稳态箭头状态(SAR,steady arrowhead regime)、弹性惯性湍流(EIT)和“混沌箭头状态”(CAR,chaotic arrowhead regime)。SAR对于此处考虑的所有参数都是稳定的,而最后一对(混沌)流状态在视觉上非常相似,并且只能通过CAR状态中存在弱聚合物箭头结构来区分。两种混沌状态都由相同的近壁机制维持,弱箭头不起作用。该数据集包括四个吸引子以及两个边缘状态的快照。边缘状态是存在于两个吸引子盆地之间边界上的不稳定状态,即所谓的边缘流形。边缘状态在流形之外有一个不稳定的方向,并且是相关的,因为它正好位于边界上,从而分隔了定性不同的流动行为。本数据集中的边缘状态是通过层态(LAM)与EIT之间以及EIT与SAR之间的边缘跟踪获得的。数据中令研究者感兴趣的现象是:(i)EIT和CAR中粘弹性流动中的混沌动力学。另请注意,它们是单独的状态。(ii)对于同一组参数的多重稳定性,流根据初始条件有四种不同的行为。尾声Ohana表示,收集这些数据是一项挑战。该团队与科学家合作,为该项目收集和创建数据。“数值模拟的创造者有时会因为过度炒作而对机器学习持怀疑态度,但他们对它以及它如何使他们的研究受益并加速科学发现感到好奇,”他说。Polymathic AI团队本身现在正在使用这些数据集来训练AI模型。在接下来的几个月里,他们将把这些模型部署到各种任务上,看看这些全面、训练有素的AI在解决复杂的科学问题方面有多成功。“了解机器学习模型如何在来自不同物理系统的数据集之间进行概括和插值是一项令人兴奋的研究挑战,”CCM研究员、Polymathic AI成员Régaldo-Saint Blancard说。Polymathic AI团队已开始使用这些数据集训练机器学习模型,Polymathic AI项目负责人Shirley Ho表示:“早期结果非常令人兴奋。” Shirley Ho是Flatiron研究所计算天体物理中心的团队负责人。“我也很期待看到其他AI科学家会如何处理这些数据集。就像蛋白质数据库催生了 AlphaFold一样,我很高兴看到Well和多模态宇宙数据集将帮助创造什么。” Ho将在NeurIPS会议上发表演讲,重点介绍这项工作的用途和巨大潜力。参考资料https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/https://vimeo.com/1035234539https://polymathic-ai.orghttps://polymathic-ai.org/the_well/https://huggingface.co/MultimodalUniversehttps://nips.cc/virtual/2024/poster/97791https://neurips.cchttps://github.com/MultimodalUniverse/MultimodalUniverse/https://github.com/PolymathicAI/the_well/https://www.nobelprize.org/all-nobel-prizes-2024/

来源:科技前沿

相关推荐