摘要:在材料设计的早期阶段,这项任务极为繁重。研究人员曾花费上千年时间,通过混合铅、汞和硫等物质,并尝试以他们认为最佳的比例来制造黄金。即使是像布拉赫、波义耳和牛顿这样的著名科学家也曾参与过这种被称为“炼金术”的徒劳尝试。
在材料设计的早期阶段,这项任务极为繁重。研究人员曾花费上千年时间,通过混合铅、汞和硫等物质,并尝试以他们认为最佳的比例来制造黄金。即使是像布拉赫、波义耳和牛顿这样的著名科学家也曾参与过这种被称为“炼金术”的徒劳尝试。
当然,材料科学如今已经取得了长足的进步。在过去的 150 年里,借助元素周期表,研究人员认识到不同元素具有独特的性质,而且一种元素不可能通过魔法般的方式转变成另一种。此外,近十年来,机器学习工具极大地提升了我们确定各种分子和物质结构及物理性质的能力。
近期,由麻省理工学院材料科学与工程系李巨教授领导的一个小组的新研究有望在促进材料设计的能力方面实现重大飞跃,他们的研究成果已经发表在 Nature Computational Science 上。
目前,大多数用于表征分子系统的机器学习模型都依赖于密度泛函理论(DFT),这种理论是一种量子力学方法,通过研究电子密度分布来确定分子或晶体的总能量。所谓电子密度分布,是指单位体积内每个空间点附近的平均电子数量。这一理论的开创性工作由 Walter Kohn 在 60 年前提出,他也因此于 1998 年获得了诺贝尔化学奖。尽管密度泛函理论在许多领域取得了成功,但它并非完美无缺。正如李巨所指出的那样:“首先,其精度并不总是足够高;其次,它只能告诉你一件事:分子系统的最低总能量。”
耦合簇理论
李巨的研究团队采用了一种不同的计算化学技术,这种技术同样基于量子力学,被称为耦合簇理论 (CCSD(T))。他表示:“这是量子化学的黄金标准。”与密度泛函理论相比,耦合簇理论的计算结果更为精确,其准确性可以与目前通过实验获得的数据相媲美。然而,耦合簇理论的一个缺点是计算效率极低,且难以扩展。
他解释道:“如果系统中的电子数量翻倍,计算成本会增加 100 倍。”因此,耦合簇理论的应用通常局限于规模较小的分子系统,通常包含大约 10 个原子。对于更大规模的系统,计算所需的时间和资源将变得难以承受。
而这恰恰是机器学习发挥关键作用的地方。首先,研究团队利用传统计算机执行耦合簇理论计算,并将结果用于训练他们专门设计的新型架构神经网络。经过训练后,该神经网络能够通过近似方法加快计算速度。此外,这种神经网络模型不仅可以计算分子的能量,还能提取更多属性信息。麻省理工学院材料科学与工程系的博士生 Hao Tang 解释道:“在以往的研究中通常需要使用多个不同的模型来评估不同的属性,而我们仅需一个模型就能同时评估所有这些属性,这也是为什么我们将其称为‘多任务’方法。”
这种名为 Multi-task Electronic Hamiltonian Network (MEHnet) 的神经网络模型能够揭示多种电子性质,例如偶极矩、四极矩、电子极化率以及光学激发间隙。Hao Tang 表示,“激发间隙对材料的光学性质有重要影响,因为它决定了分子能够吸收的光的频率。”此外,基于耦合簇理论数据训练的模型不仅可以揭示基态属性、预测激发态的性质,还能够预测与分子振动性质相关的红外吸收光谱。在这种光谱中,分子内原子的振动相互耦合,从而表现出多种复杂的集体行为。这些能力使 MEHnet 成为分析和设计复杂分子系统的强大工具。
这种方法的强大之处在很大程度上归功于网络架构的创新设计。Hao Tang 指出,团队借鉴了麻省理工学院助理教授 Tess Smidt 的研究成果,采用了一种被称为 E(3)-Equivariant Graph Neural Network 的架构。“在这种网络中,节点表示原子,而连接节点的边表示原子之间的键关系。同时,我们还设计了定制算法,将量子力学中计算分子性质的物理原理直接整合到模型中。” 他说道。
开始测试
在已知的碳氢化合物分子分析测试中,李巨团队开发的模型表现优于传统的密度泛函理论方法,其结果与已发表文献中的实验数据高度一致。
美国北卡罗来纳大学夏洛特分校的材料专家 Qiang Zhu(未参与该研究)对这项研究成果给予了高度评价。他表示:“他们的方法能够在小数据集上实现有效训练,同时相比现有模型,具有更高的精度和计算效率。这是一项令人兴奋的研究,展示了计算化学与深度学习之间的强大协同作用,为开发更精确且可扩展的电子结构方法提供了新思路。”
麻省理工学院团队首先将模型应用于由小型非金属元素,如氢、碳、氮、氧和氟组成的有机化合物。随后,他们将研究范围扩展至更重的元素,包括硅、磷、硫、氯,甚至贵金属铂。在针对小分子进行训练后,该模型表现出了很强的推广能力,可以用于分析更大规模的分子系统。李巨指出:“以前,大多数计算仅限于分析包含数百个原子的系统或数十个原子的系统。现在,我们讨论的是能够处理数千个原子的能力,而未来甚至可能扩展到数万个原子的分子系统。” 这种规模的提升为研究复杂分子和材料设计开辟了新思路。
目前,研究人员主要专注于评估已知分子,但该模型的应用潜力远不止于此,它还可以用于表征未知分子,并预测由不同分子组成的假设材料的性质。“我们的目标是利用这一理论工具筛选出满足特定标准的候选分子,然后将这些建议提供给实验人员进行验证。”Hao Tang 补充道。
应用才是关键
展望未来,Qiang Zhu 对这种方法的潜在应用持乐观态度。他表示:“这一方法有望实现高通量分子筛选。在这一过程中,化学精度对于发现具有理想特性的全新分子和材料至关重要。”
李巨进一步指出,“一旦团队能够成功证明其模型分析包含数万个原子的超大型分子的能力,我们将能够发明用于药物设计或半导体设备的新型聚合物或材料。” 他还强调,对重过渡金属元素的深入研究可能为开发新一代电池材料提供关键突破,而这是当前技术和社会发展的紧迫需求之一。
在李巨看来,未来充满了无限可能。“这不仅局限于某一个领域,”他说道,“我们的最终目标是以比密度泛函理论更低的计算成本,在耦合簇理论级别的精度下覆盖整个元素周期表。这将使我们能够解决化学、生物学和材料科学中的各种问题。目前还难以预料这种方法的潜力究竟有多广。”
这项研究得到了本田研究所的资助,此外,部分计算工作是在 Matlantis 高速通用原子模拟器、德克萨斯高级计算中心、MIT SuperCloud 和国家能源研究科学计算中心上完成的。
原文链接:
来源:DeepTech深科技