高质量3D分子生成,西安电子科技大学开发用于分子设计的AI模型

360影视 日韩动漫 2025-05-05 17:27 2

摘要:为了应对这些挑战,西安电子科技大学(Xidian University)的研究团队提出了用于三维分子设计的多尺度图等变扩散模型(multiscale graph equivariant diffusion model for 3D molecule desig

编辑 | 白菜叶

三维分子生成在药物设计中至关重要。

然而,目前的方法通常依赖于点云或过于简化的相互作用模型,限制了其准确表征分子结构的能力。

为了应对这些挑战,西安电子科技大学(Xidian University)的研究团队提出了用于三维分子设计的多尺度图等变扩散模型(multiscale graph equivariant diffusion model for 3D molecule design,MD3MD)。

MD3MD 将分子构象划分为多尺度图,并分配不同的权重以捕捉跨尺度的原子相互作用。该框架指导扩散过程,从而实现高质量的 3D 分子生成。

实验结果表明,MD3MD 在无条件和条件生成任务中均表现出色,能够生成满足特定条件的多样化、稳定且创新的分子。

可视化凸显了 MD3MD 学习领域特定模式的能力,它能够在保持分布一致性的同时生成与现有数据集不同的分子。通过有效探索化学空间,MD3MD 在生成创新且化学多样性的分子方面超越了以往的方法,为分子设计领域带来了显著的进步。

该研究以「Multiscale graph equivariant diffusion model for 3D molecule design」为题,于 2025 年 4 月 16 日发布在《Science Advances》。

药物研发的目的是识别具有最佳特性的候选分子,用于临床试验。然而,传统方法通常耗时费力,成本高昂,且成功率低。

近年来,基于人工智能的深度模型通过数据驱动的方式探索广阔的化学空间,在分子开发中展现出显著的潜力,从而加速了药物研发进程。

其中,三维(3D)分子生成因其能够直接生成与真实药物极为相似的三维分子构象,已成为药物设计中不可或缺的一部分。

受几何深度学习的启发,西电的研究团队提出了一种用于三维分子设计的多尺度图等变扩散模型(MD3MD)的原创方法,用于解决现有方法在全面表征三维分子结构方面的局限性。

图示:QM9 上无条件分子生成的可视化。(来源:论文)

首先,本研究通过计算分子中原子间的距离并设定阈值范围,将分子构象划分为多个尺度的三维分子图,从而捕捉分子复杂的内部结构,准确模拟化学键的形成。

其次,在生成过程中为不同尺度的图赋予不同的权重,灵活控制不同原子间相互作用的重要性。

性能评估

研究人员对 MD3MD 在多个基准测试中进行了详细评估,包括无条件和有条件分子生成任务。

无条件生成任务的结果表明,该方法优于现有方法,能够生成更具实用性和创新性的分子。它可以生成具有更高原子和分子稳定性的分子。

在基准数据集上进行的条件生成结果表明,与现有方法相比,MD3MD 能够生成更符合预期特性的分子。

可视化结果显示,MD3MD 能够有效地学习领域知识,并生成与现有数据集显著不同但与其分布一致的创新分子。此外,该方法广泛探索了化学空间,生成高度多样化的分子,并避免了模式崩溃。

图示:生成的分子与 QM9 数据集之间的原子数、键数、环数和原子间距离分布的比较。(来源:论文)

值得一提的是,研究人员还尝试明确纳入除共价相互作用之外的所有原子相互作用力,用于指导分子生成过程。他们发现,在某些情况下,这种表示方法比考虑所有化学键相互作用能产生更好的分子性能。

当然,MD3MD 也存在一些局限性:该方法没有深入探索当条件为非标量值时如何实现条件引导的分子生成(例如基于配体的分子生成),这将是未来研究的一个方向。

此外,进一步理解模型如何利用条件信息指导分子生成并提供可解释的结果,以拓展 MD3MD 方法在分子设计与发现领域的适用性和实用性,提高其应用效果和效率,也是未来深入研究的重要方向。

不过,由于扩散模型的复杂性以及 GEOM 数据集的庞大规模,以及硬件条件的限制,在这项研究中研究人员仅尝试将 GEOM 数据集的分子图划分为三个尺度图。

在未来的实验中,研究人员表示将通过知识蒸馏等方法,尽可能降低模型的复杂度并探索数据集中的原子相互作用,这将是一个挑战。

论文链接:

来源:孤独难学科技

相关推荐