利用大模型实现自动科学发现,ICLR 2025 展示 AI For Science新进展

360影视 2025-02-06 15:45 1

摘要:在科学探索的漫漫征途中,人类一直凭借着智慧与好奇心不断开拓未知领域。如今,人工智能(AI)的迅猛发展,为科学研究带来了前所未有的变革。ICLR 2025 接收的一篇论文《MOOSE-Chem: Large Language Models for Redisco

在科学探索的漫漫征途中,人类一直凭借着智慧与好奇心不断开拓未知领域。如今,人工智能(AI)的迅猛发展,为科学研究带来了前所未有的变革。ICLR 2025 接收的一篇论文《MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses》,宛如一颗投入平静湖面的石子,激起层层涟漪,引发了学界对 AI 在科学发现中角色的深度思考。

论文链接:

长久以来,AI 在自然语言处理和计算机视觉领域的成就有目共睹,从智能语音助手到图像识别技术,已深度融入人们的生活。但当面对科学研究这一充满深度与复杂性的领域时,AI 能否真正发挥作用,帮助科学家揭示新的科学理论?这一问题一直悬而未决。而 MOOSE-Chem 的研究,似乎为解答这一难题提供了新的思路。

MOOSE-Chem 研究的核心假设独树一帜:化学研究假设并非凭空产生,而是由研究背景与若干研究灵感巧妙组合而成。这一假设并非空穴来风,其背后有着深厚的理论支撑。从认知科学角度来看,创造力研究表明创新往往源于已有知识的重新组合。知识重组理论指出,科学发现常常是跨领域知识相互碰撞的结果;联想理论也认为,创新通过已有概念的连接得以实现。在实际的科学研究中,许多重大突破都印证了这一点。反向传播算法,正是 “链式求导 + 多层神经网络” 的完美结合;新型催化剂的诞生,也离不开 “已有材料 + 新工艺” 的融合。这些都有力地说明,化学研究假设很可能是背景知识与研究灵感共同作用的结晶。

为了进一步验证这一假设,研究团队对顶级化学论文展开了深入分析。他们从 Nature、Science 等权威期刊中精心选取了 51 篇 2024 年的化学论文,手动拆解其核心结构,包括研究背景、研究灵感以及研究假设。令人惊喜的是,所有论文的核心创新点都能清晰地追溯到 “背景 + 若干关键灵感”。更令人惊讶的是,部分论文的灵感竟来自跨学科领域,这进一步为 “知识重组” 假设提供了坚实的数据支持。

基于这一核心假设,研究团队开启了复杂而精妙的数学推导之旅。他们试图用概率建模来描述科学发现的过程,即计算 P(h | b )。通过巧妙地利用核心假设、链式法则,并引入马尔科夫性质,最终成功得到了 P(h | b )的一个约等式。这一约等式意义非凡,它将原本复杂得难以建模的 P(h | b ),转化为一系列难度显著降低、可建模的小项乘积,为后续的研究奠定了坚实的数学基础。

那么,AI 究竟如何借助这一理论框架进行自动科学发现呢?MOOSE-Chem 框架给出了详细的解答,整个过程分为三个关键步骤。

第一步是文献检索,旨在从海量的化学论文中精准找到潜在的研究灵感。MOOSE-Chem 创新性地采用大语言模型(LLMs)结合信息检索的方法。以研究背景作为输入,LLM 如同一位知识渊博的学者,通过语义相似性搜索在论文数据库中迅速筛选出相关研究。例如,当研究背景涉及某种新型催化剂时,LLM 便能精准检索到相关的催化剂研究,并从中提取关键技术或方法,为后续的研究提供丰富的素材。

第二步是假设生成,这是一个充满创造性的过程。有了研究灵感后,MOOSE-Chem 需要根据背景信息和灵感,构建全新的科学假设。就像科学家在头脑风暴时,将已有知识与新的灵感相互融合,提出新的研究方向。MOOSE-Chem 首先基于 LLM 的 Prompt 生成,将研究背景、灵感以及上一个步骤的研究假设作为 prompt 输入,让 LLM 生成当前步骤的假设。若背景涉及某种电化学反应,灵感来自某种新的催化材料,LLM 便能根据这些信息,巧妙构思出新型电化学方案。为了确保生成的假设具有高质量,MOOSE-Chem 还引入了进化算法,包括变异、精炼和重组三个关键步骤。变异通过对初始假设进行调整,如改变催化剂的类别、调整反应条件等,探索更多的可能性;精炼则让 LLM 通过自我反馈机制,对假设进行优化,使其更加科学合理;重组从多个假设变体中筛选出最佳元素,组合成最终的高质量假设,这一过程与科学家在论文写作中不断优化研究思路的过程如出一辙。

第三步是假设排序,MOOSE-Chem 生成的众多假设并非都合理,因此需要对它们进行评估,筛选出最优的科学假设。MOOSE-Chem 采用基于 GPT-4o 的评分方式,让 GPT-4o 从创新性、合理性、实验可行性等多个维度对每个假设进行全面评估,从而挑选出最具价值的假设。

实验结果令人振奋,充分展示了 LLM 在科学发现中的巨大潜力。在文献检索方面,LLM 能够在 3000 篇论文库中成功识别与研究背景相关但未知的启发性论文,即使只筛选出 4% 的论文,也能找到 75% 以上的真实启发论文,这表明 LLM 可能已经掌握了许多科学家尚未察觉的知识关联。在假设生成环节,采用严格背景信息和文献筛选策略后,LLM 生成的假设与真实假设相似度颇高,28 个假设的最高匹配评分(Top MS)为 4 或 5 分(满分 5 分),其中 9 个假设的最高匹配评分达到了 5 分,几乎与真实假设一致,这充分说明 LLM 具备从背景 + 启发中推理出创新性假设的能力。在假设排序方面,采用 LLM 评分机制后,高质量假设通常排名更高,与真实论文中使用的启发数量相关性较强,即启发匹配越多,排名越高,匹配评分越高,这表明 LLM 在一定程度上能够筛选出更有价值的假设。

最终,MOOSE-Chem 在实际应用中展现出了强大的实力。它生成的假设在不访问真实假设的情况下,能够覆盖论文的核心创新点。在 51 篇论文的评测中,近 40% 的实验生成假设与真实假设高度相似。在模拟现实科学研究环境(300 篇论文库)下,经专家评估,MOOSE-Chem 仍能生成接近真实论文的假设。与现有方法相比,MOOSE-Chem 在最高匹配评分(Top MS)和平均匹配评分(Average MS)上均有显著提升,这充分证明了多步启发和变异 / 重组策略有效提升了假设质量。在科学研究过程中,MOOSE-Chem 可作为得力的科研助理,自动检索启发性文献、生成研究假设,并提供初步筛选排名,大大减少了研究人员的筛选和构思时间。

MOOSE-Chem 的研究成果无疑为 AI 在科学发现领域的应用开辟了一条崭新的道路。但这仅仅是一个开始,AI 在科学研究中的应用仍面临诸多挑战。例如,如何进一步提高 LLM 的准确性和可靠性,如何更好地处理跨学科知识的融合,以及如何确保 AI 生成的假设符合科学伦理等。尽管前路漫漫,但 MOOSE-Chem 的研究让我们看到了 AI 在科学发现中的无限潜力。或许在不久的将来,AI 将成为科学家们不可或缺的得力助手,与人类携手共进,共同探索宇宙的奥秘,推动科学的边界不断向前拓展。

来源:人工智能学家

相关推荐