摘要:以ChatGPT为代表的生成式人工智能技术,正以前所未有的速度改变着药物研发的格局。这一技术能够从零开始,创造出全新的分子或化合物,无需依赖传统的模板或分子框架,为药物设计领域带来了革命性的突破。
以ChatGPT为代表的生成式人工智能技术,正以前所未有的速度改变着药物研发的格局。这一技术能够从零开始,创造出全新的分子或化合物,无需依赖传统的模板或分子框架,为药物设计领域带来了革命性的突破。
然而,尽管生成式AI在药物设计上展现出巨大的潜力,但所生成的分子实用性却常常受到限制。许多设计都聚焦于一组狭窄的药物相关特性,导致后续药物发现过程的成功率难以提升。为了破解这一难题,微软研究院科学智能中心、中国科学技术大学以及全球健康药物研发中心(GHDDI)携手合作,共同开发了AI药物设计平台TamGen。该平台采用类似GPT的化学语言模型方法,为创新药物发现开辟了全新的路径。
TamGen通过基于Transformer自注意力机制的生成式AI模型,实现了针对致病靶蛋白的分子精准生成、优化以及合成与生物实验验证。这一创新技术不仅提高了分子的质量和活性,还显著加速了药物研发的过程。将TamGen集成到药物发现流程中,研究团队成功确定了14种对结核杆菌ClpP蛋白酶具有显著抑制活性的化合物,其中最有效的化合物显示出半数最大抑制浓度(IC50)仅为1.9μM。
GHDDI中心主任丁胜对此表示:“TamGen的初步成果标志着生成式药物设计领域的一项重要创新,为未来的AI药物研发提供了强有力的实用性和适用性证据。随着人工智能技术在药物发现领域的不断进步,TamGen有望大幅加速新药研发,为应对包括结核病在内的多种公共卫生挑战提供有力支持。”
相关研究以“TamGen:基于目标感知分子生成的化学语言模型在药物设计中的应用”为题,于10月29日发表在《Nature Communications》上。论文详细阐述了TamGen的模型架构、技术原理以及在实际药物设计中的应用效果。
面对生成式药物设计的挑战,TamGen通过引入交叉注意力机制,并结合大量的已知和模拟的蛋白-配体结构数据,实现了在生成新化学分子时同时考虑致病靶蛋白的信息。这一改进使得TamGen能够基于靶蛋白活性位点信息精准生成具备潜在相互作用的分子,进而增强了分子生成的靶向性以及药物设计的合理性与精准度。再结合分子模拟、细胞活性AI模型与专家经验进一步虚拟筛选与优化,TamGen显著提升了发现候选药物的效率与成功率。
GHDDI数据科学平台负责人郭晋疆博士形象地比喻道:“传统的生成式AI设计方法更像是先造出无数把钥匙,再一把一把地试能否打开门。而TamGen则像是在比对锁眼,更精确地匹配钥匙。”
为了对TamGen的整体性能进行基准测试,研究人员将其与最近提出的五种方法进行了比较。结果显示,TamGen在多个指标上均表现出优势,始终名列前茅。尤其是在生成具有高结合亲和力的化合物方面,TamGen在SAS方面表现最佳,这些化合物可能对靶蛋白具有优异的生物活性。
此外,TamGen在效率方面也展现出卓越的性能。使用一台A6000 GPU对所有方法的每个靶标生成100种化合物的时间进行基准测试发现,其他方法需要数十分钟或数小时才能完成此任务,而TamGen平均仅需9秒即可完成。这使得TamGen在药物设计领域具有极高的竞争力。
接下来,研究人员使用TamGen设计针对ClpP的小分子抑制剂。结核病是由结核分枝杆菌(Mtb)引起的传染病,而ClpP作为细菌蛋白质降解系统中必需的丝氨酸蛋白酶,是抗生素开发的新兴靶点。通过TamGen驱动的设计-改进-测试流程,研究团队成功发现了14种对Mtb ClpP表现出良好效力的候选化合物,半数最大抑制浓度(IC50)范围为1.88μM至35.2μM。这些发现不仅丰富了进一步优化的候选池,还为命中扩展和构效关系(SAR)合成提供了有效的靶点。
展望未来,TamGen的研究方向将聚焦于整合更多三维生成方法的优势,如采用蒙特卡洛树搜索(MCTS)或分子动力学模拟技术,以进一步改善生成化合物与靶蛋白的结合能力及其他重要药物性质,如稳定性、合成可能性以及ADME/T特性。这将为TamGen在药物设计领域的广泛应用奠定更加坚实的基础。
TamGen的成功不仅体现了生成式AI在药物研发领域的巨大潜力,也为我们应对各种公共卫生挑战提供了新的思路和解决方案。随着技术的不断进步和应用的深入拓展,相信TamGen将在未来药物研发领域发挥更加重要的作用。
华远系统是致力于人工智能(AI算法以及流媒体技术),信息软件技术,新能源、物联网等领域的集成商,在智慧社区,智慧园区,智慧停车,充电桩(储能充电站/光储充)及充电桩软件管理平台,储能系统集成,车联网有整套解决方案以及成功的项目案例。
来源:华远系统一点号