仅需1秒生成药物分子,生成式AI方法DiffSMol登Nature子刊

360影视 国产动漫 2025-05-14 12:13 1

摘要:目前,高通量筛选等传统药物开发方法依赖于随机试错,无法保证获得最佳设计。为了应对这些挑战,生成式人工智能方法应运而生,可以直接设计具有所需特性的分子。

编辑 | 萝卜铍

药物开发是一个极端重要但又极其耗费资源和时间的过程。通常,完整开发一种成功的药物需要10 到 15 年的时间以及 10 到 16 亿美元的投入。

目前,高通量筛选等传统药物开发方法依赖于随机试错,无法保证获得最佳设计。为了应对这些挑战,生成式人工智能方法应运而生,可以直接设计具有所需特性的分子。

俄亥俄州立大学(The Ohio State University,OSU)的研究团队开发了一种用于药物发现的生成式人工智能方法 DiffSMol,该方法基于已知的配体形状生成 3D 小分子结合分子。

DiffSMol 将配体形状细节封装在预训练的、富有表现力的形状嵌入中,并通过扩散模型生成结合分子。DiffSMol 进一步迭代修改生成的 3D 结构,使用形状引导使其更好地模拟配体形状,并使用蛋白质口袋引导来优化结合亲和力。

这一方法大幅度提高了药物分子的发现精度,缩减了开发时间。论文的共同第一作者 Chen Ziqi 表示,与现有的药物设计计算方法相比,DiffSMol 只需一秒钟就能生成一个分子。

该研究以「Generating 3D small binding molecules using shape-conditioned diffusion models with guidance」为题,于 2025 年 5 月12 日发布在《Nature Machine Intelligence》。

为了加快药物研发进程并提高成本效益,学界与业界有大量的研究投入用于开发促进药物研发的计算方法。现有的用于设计潜在候选药物的计算方法可分为两类,基于配体的药物设计 (LBDD) 和基于结构的药物设计 (SBDD)。

这两种方法分别在分子库中搜索以识别与已知配体相似的分子或与已知蛋白质靶标结合位点结合的分子。虽然 LBDD 和 SBDD 的潜力巨大,但它们的试错模式受限于分子库规模,导致实验结果过于主观且难以规模化。

图示:根据 SQUID 和 DiffSMol 生成的分子计算出的相似性热图。(来源:论文)

生成式人工智能(genAI)通过自主学习分子数据生成特定属性分子,有望变革传统药物开发流程,实现更精准高效的药物设计。genAI 的强大生成能力不仅突破了传统方法的局限,还为快速、可持续的药物研发提供了全新路径。

图示:通过不同方法生成的 3D 分子。(来源:论文)

DiffSMol

俄亥俄州立大学研究团队提出的 genAI 方法 DiffSMol,可以用于生成能够有效结合蛋白质靶标并具有真实结构(例如,正确的键角和键长)的 3D 分子。

受 LBDD 启发,DiffSMol 根据已知配体的形状生成新的结合分子,遵循形状相似的分子往往具有相似的结合活性的原理。DiffSMol 将配体形状的几何细节封装在预先训练的、富有表现力的形状嵌入中,并通过扩散生成新的结合分子,包括它们的原子类型和原子位置。

图示:DiffSMol 的模型架构。(来源:论文)

「通过使用众所周知的形状作为条件,我们可以训练我们的模型来生成以前的化学数据库中不存在的具有相似形状的新分子。」文章的通讯作者、俄亥俄州立大学生物医学信息学和计算机科学与工程教授 Xia Ning 解释道。

在迭代扩散过程中,DiffSMol 利用一种新颖的分子图表示学习方法,并结合配体形状嵌入来生成和优化原子类型和原子位置,从而生成新的分子及其三维结构。

为了更好地模拟已知的配体形状,DiffSMol 在配体形状的指导下进一步迭代修改生成的三维结构。受 SBDD 的启发,除了配体之外,DiffSMol 还可以利用蛋白质结合口袋的几何信息,并在结合口袋的指导下定制生成的分子,使其具有最佳的结合亲和力。

性能评估

全面的实验表明,与当前最先进的形状条件分子生成 (SMG) 方法相比,DiffSMol 在生成与配体形状高度相似的分子方面表现出色。

值得注意的是,DiffSMol 在生成与配体形状高度相似且具有新颖图结构的分子方面成功率高达 28.4%,远高于最佳 SMG 方法 11.2% 的成功率。

加入形状引导后,DiffSMol 的性能进一步提升,成功率高达 61.4%,同时生成逼真的 3D 分子。这说明了 DiffSMol 预训练形状嵌入在捕捉配体形状几何细节方面的有效性,以及其定制扩散模型在生成逼真且新颖的结合分子方面的能力。

此外,通过利用蛋白质结合口袋的几何信息,采用口袋引导的 DiffSMol 比最佳口袋条件分子生成(PMG)方法生成分子的结合亲和力提高了 13.2%。当同时结合口袋引导和形状引导时,优化程度可达 17.7%。

实践验证

针对两个重要药物靶点——与淋巴瘤和白血病等多种癌症高度相关的细胞周期蛋白依赖性激酶 6(CDK6)和与阿尔茨海默病高度相关的脑啡肽酶 (NEP)——进行了大量计算机模拟分析的案例研究表明,DiffSMol 可以有效地生成针对这些靶点的类药物分子。

图示:为 CDK6 生成候选药物 NL-001。(来源:论文)

所研究的两种 CDK6 生成分子的结合亲和力(Vina 评分)分别为 -6.817 kcal/mol 和 -6.970 kcal/mol,优于已知的 CDK6 配体(0.736 kcal/mol);而所研究的 NEP 生成分子的 Vina 评分也高达 -11.953 kcal/mol,优于已知的 NEP 配体(-9.399 kcal/mol)。

图示:为NEP生成候选药物NL-003。(来源:论文)

这些分子还具有良好的类药物特性,其 QED 值接近或高于 0.8,毒性评分低(0.000 至 0.236),并符合 Lipinski 五规则。值得注意的是,它们的吸收、分布、代谢、排泄和毒性(ADMET)特性与 FDA 批准的药物相当。

「找到比已知配体性能更优异的分子,这对我们来说非常鼓舞人心。」Chen Ziqi 说,「这表明我们开发的模型在识别优质候选药物方面具有巨大潜力。」

论文链接:

相关报道:

来源:科学研习社

相关推荐