摘要:多功能生成能力:MatterGen 可生成稳定、多样的无机材料,覆盖整个元素周期表,并通过调优满足特定化学性质、对称性和标量属性的约束。先进的扩散过程:采用定制扩散模型,能够联合生成材料的原子类型、坐标和晶格参数,显著提高生成结构的稳定性、独特性和新颖性。实验
转自:理论计算科学公众号
通讯作者及单位:Microsoft Research AI for Science
Ryota Tomioka,Tian Xie
多功能生成能力:MatterGen 可生成稳定、多样的无机材料,覆盖整个元素周期表,并通过调优满足特定化学性质、对称性和标量属性的约束。
先进的扩散过程:采用定制扩散模型,能够联合生成材料的原子类型、坐标和晶格参数,显著提高生成结构的稳定性、独特性和新颖性。
实验验证:生成的材料不仅在理论上具备优良性能,还通过实验验证,成功合成并测量了一个高模量材料。
性能大幅提升:相较于现有方法(如CDVAE和DiffCSP),MatterGen生成的结构在稳定性、独特性和与能量最低点的接近程度上都有显著优势。
多目标优化:展示了多属性优化能力,例如同时设计低供应链风险和高磁密度的材料。
主要内容:
图1:展示了MatterGen模型的三部分流程:扩散过程:将初始随机结构逐步破坏,形成随机材料。原子类型 ( 𝐴 A)、坐标 ( 𝑋 X) 和晶格 ( 𝐿 L) 分别独立处理。通过添加噪声,形成接近物理分布的随机材料。反向去噪:通过一个等变(equivariant)得分网络,逐步去噪,生成稳定的晶体结构。微调模块:在预训练模型基础上,通过适配模块 (adapter modules) 调整输出,以满足特定属性的约束。目标包括化学成分、对称性和标量属性(如磁密度)。示例:在Li-Co-O系统中生成的LiCoO₂材料,具有目标对称性(P6₃/mmc)和磁密度。
图2:生成稳定、独特和新颖(S.U.N.)材料 内容:(a) 随机选择的四个由MatterGen生成的晶体,标注了其化学式和空间群。(b) 生成结构的能量分布(相对于能量凸包)。使用两个参考数据集 (MP和Alex-MP-ICSD) 测试。超过75%的结构能量距离凸包小于0.1 eV/atom,表示较高稳定性。(c) 生成结构与DFT松弛后的均方根偏差 (RMSD) 分布。95%的结构RMSD小于0.076 Å,表明生成结构非常接近能量最低点。(d) 生成结构的独特性和新颖性变化随数量的变化。生成1000个时,独特性为100%,生成1000万后下降到52%。(e-f) 与基线模型对比,MatterGen生成的S.U.N.材料比例显著更高,RMSD更低。
图3:内容:(a-b) 不同化学系统类型和复杂度下,MatterGen生成的S.U.N.材料比例。比较了三种方法:MatterGen、替代法、随机结构搜索 (RSS)。MatterGen在所有类别中表现最佳,特别是在复杂的五元系统中。(c-d) 生成在凸包上的结构数量分布。MatterGen在“部分探索”和“完全探索”的系统中找到最多凸包结构。(e) V-Sr-O系统的凸包图,显示不同方法生成的结构位置。(f-i) MatterGen发现的四个凸包结构示例,包括化学式和空间群。亮点:MatterGen在复杂化学系统中表现卓越,生成效率远高于替代法和RSS。在V-Sr-O系统中,MatterGen重新发现3个已知结构并发现1个新结构。
图4:内容:(a-c) 三种逆向设计任务:(a) 高磁密度材料(目标值0.2 Å 3 3 ),分布明显向目标值偏移。(b) 带隙为3.0 eV的材料。(c) 高体模量材料(目标值400 GPa)。(d-f) 每项任务中性能最优的S.U.N.结构示例,展示其化学式、空间群和属性值。(g-h) 在有限DFT计算预算下,MatterGen找到的极端属性S.U.N.结构数量。(g) 磁密度任务:180次DFT计算找到18个满足条件的结构。(h) 高体模量任务:预算为180次时,MatterGen找到的106个S.U.N.结构是筛选法的2倍。
图5:low-supply-chain-risk内容:(a) Fine-tuned模型生成S.U.N.结构的磁密度和HHI分布。联合优化(joint)使结构分布更加接近目标,同时保持高磁密度。(b) 不同元素在S.U.N.结构中的出现频率。Co和Gd等高供应链风险元素的使用显著减少。(c) 符合多属性约束的Pareto前沿结构,包括化学式、空间群、磁密度和HHI得分。
图6:内容:(a) TaCr₂O₆材料的XRD谱图,包含实验数据、理论拟合和主要峰位标注。(b) MatterGen生成的TaCr₂O₆结构示意图,展示化学式、空间群和DFT预测的体模量值。(c) 实验合成的TaCr₂O₆无序结构示意图。(d) MatterGen生成的与ICSD数据库匹配的结构体模量分布及预测误差。
来源:老赵的科学课堂