摘要:今天推送的是来自Cell的一篇文章《Discovery of antimicrobial peptides in the global microbiome with machine learning》,该文章提出了一个利用机器学习预测全球微生物组中抗菌肽(A
今天推送的是来自Cell的一篇文章《Discovery of antimicrobial peptides in the global microbiome with machine learning》,该文章提出了一个利用机器学习预测全球微生物组中抗菌肽(AMPs)的新方法。该方法识别了近一百万个抗菌肽序列,为抗生素发现提供了一个开放的资源。
——背景——
抗生素耐药性感染日益严重,迫切需要发现新的抗生素。AMPs作为潜在治疗药物,已经作为抗病毒药物在临床上使用,通常通过与细胞膜相互反应导致细胞裂解来发挥作用不易产生耐药性。由于技术限制,特别是难以区分真正蛋白质编码序列与假阳性序列,宏基因组分析在AMPs研究中的应用受到限制。近年来,在人类相关smORFs的宏基因组分析方面取得了显著进展,包括使用机器学习技术识别特定功能类别的蛋白质编码smORFs。因此该研究使用机器学习预测和分类公共数据库中当前代表的全球微生物组中的AMPs。
——研究方法——
1)数据获取和处理:从欧洲核苷酸档案库(ENA)下载公共宏基因组数据,从ProGenomes2数据库中选择了高质量的微生物基因组。最终,共纳入了63,410个公共宏基因组和87,920个高质量微生物基因组。
2)读取修剪和组装:使用NGLess对碱基序列进行修剪,然后使用MEGAHIT 1.2.9测序DNA进行了组装,并根据先前描述的方法,使用MMSeqs2将生成的连续序列(contigs)与GTDB 95版数据库进行比对,以推断其分类学信息。然后,对映射得到的分类学谱系进行了手动整理,以符合《国际原核生物命名法规》。
3)smORF 和 AMP 预测:本研究使用Prodigal34 的修改版本来预测重叠群中的 smORF并进行去重复。Macrel42 在去重复的 smORF 上运行以预测 c_AMP。随后使用了Biopython中SeqUtils实现的ProtParam模块中的secondary_structure_fraction功能,通过分析氨基酸序列,计算了氨基酸倾向于形成螺旋、转角和折叠片构象的比例。
4)AMP家族聚类:本研究采用了一个简化的8 字母氨基酸字母表(使用CD-Hit进行字母表简化),并使用了三个连续的序列同一性阈值(100%、85%和75%)对肽进行了层次聚类。聚类包含至少8 条序列时被视为一个AMP家族,并选择最长序列(或按字母顺序)作为代表序列。
图1. AMPSphere构建流程
——主要结果——
1)①AMPSphere 包含来自多个栖息地的近100 万个 c_AMP,且91.5%的c_AMPs是之前未知的
②AMP发现是受到采样影响的,大多数栖息地的c_AMP含量远未饱和,且栖息地之间的重叠频率低
2)经过研究分析全长蛋白的早期终止是产生新型 c_AMP 的一种机制。同时在进行抗菌肽(AMPs)同源的全长蛋白质功能的分析时,通过将来自AMPSphere的候选抗菌肽(c_AMPs)映射到GMGCv1.52数据库中的蛋白质,并进一步与eggNOG 5.0数据库中的直系同源群体(OGs)进行比对发现未知功能的直系同源群体OGs在c_AMP hits中的富集程度最高。
3)cAMPs在基因组中的分布倾向于与包含核糖体组装蛋白的区域相关联
4)AMPSphere 的肽二级结构倾向于形成α-螺旋结构,在79 个合成AMPs(总共100个肽)对病原菌和/或肠道共生菌表现出抗菌活性,其中58%的合成AMPs(即58 个肽)在低浓度(8–16 mmol/L)下对至少一种肠道共生菌表现出抑菌效果。
5)AMPSphere来源的抗菌肽在针对鲍曼不动杆菌细胞的抗感染活性的皮肤脓肿小鼠模型中表现出与抗生素多黏菌素B相当的杀菌效果,能够减少3-4个数量级的细菌CFU
——小结——
这项研究利用机器学习从全球微生物组中发现了近一百万种候选抗菌肽(AMPs),并建立了一个名为AMPSphere的开放资源,其中许多肽具有转录或翻译的证据,能够活跃表达。大多数c_AMPs表现出栖息地特异性,且大多属于微生物基因组的配件基因组。
实验验证显示,合成的79种抗菌肽中有许多对病原菌和共生菌具有抗菌活性,部分肽在对抗鲍曼不动杆菌和万古霉素抗性肠球菌时效果显著。体内实验表明,三种肽在小鼠感染模型中有效减少细菌负荷。研究还探讨了抗菌肽的生成机制,包括基因截断和基因复制,发现很多抗菌肽可能是独立进化产生的。
但是该研究并不涵盖所有的活性肽,主要关注由自身基因编码的、多达100个氨基酸组成的肽。而且样品的覆盖范围不均匀,主要集中于某些栖息地和地区,质量估计可能会受影响。候选肽的体内体外测试,只选择了特定菌株,活性的肽可能对此处未测试的菌株具有活性。
参考文献:Célio Dias Santos-Júnior, Marcelo D.T. Torres, Yiqian Duan, Álvaro Rodríguez del Río, Thomas S.B. Schmidt, Hui Chong, Anthony Fullam, Michael Kuhn, Chengkai Zhu, Amy Houseman, Jelena Somborski, Anna Vines, Xing-Ming Zhao, Peer Bork, Jaime Huerta-Cepas, Cesar de la Fuente-Nunez, Luis Pedro Coelho,Discovery of antimicrobial peptides in the global microbiome with machine learning,Cell,Volume 187, Issue 14,2024,Pages 3761-3778.e16,ISSN 0092-8674,https://doi.org/10.1016/j.cell.2024.05.013.
来源:微生物组