摘要:大规模蛋白质组学研究能够深化对健康和疾病的理解,但现有研究仍集中于有限的疾病结局,蛋白与健康和疾病之间的关系仍然存在许多未解之谜。疾病相关的蛋白质是特异性的还是共同的?这些蛋白质能否启示疾病的生物学分类?它们能否作为疾病预测和诊断的生物标志物及潜在的治疗靶点?
题图 | Pixabay
大规模蛋白质组学研究能够深化对健康和疾病的理解,但现有研究仍集中于有限的疾病结局,蛋白与健康和疾病之间的关系仍然存在许多未解之谜。疾病相关的蛋白质是特异性的还是共同的?这些蛋白质能否启示疾病的生物学分类?它们能否作为疾病预测和诊断的生物标志物及潜在的治疗靶点?
2024年11月22日,复旦大学附属华山医院郁金泰、毛颖团队与复旦大学类脑智能科学与技术研究院程炜、冯建峰团队合作,在国际顶尖学术期刊Cell上发表了题为:Atlas of the plasma proteome in health and disease in 53,026 adults 的研究论文。
这项研究全面绘制了人类健康与疾病蛋白质组图谱,并结合人工智能大数据分析方法,构建了疾病诊断预测模型以及发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。
该研究通过深入分析53026名个体的血浆蛋白质组数据,纳入了2920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关特征,跨越了14.8年的中位随访期,揭示了168100个蛋白质-疾病关联和554488个蛋白质-表型关联。研究中发现超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性,这些发现深化了对疾病间共享和特异分子机制的理解,揭示了不同人群在疾病易感性上的差异。
人类健康与疾病血浆蛋白质组图谱
研究团队发现免疫系统相关通路在绝大部分疾病中富集,强调了炎症在人类健康中的重要作用。此外,对不同疾病之间的生物学通路的比较完善了对疾病病理生理学相似性和异质性的理解。例如,阿尔茨海默病(AD)和血管性痴呆(VaD)相关的蛋白质在与神经系统相关的共同通路中富集,而AD特异性通路大多与脂质代谢有关,VaD特异性通路与心肌有关。传统的疾病分类策略通常基于相似的临床症状和表型特征,而忽略了共同的分子病因。利用蛋白质组学特征对660种疾病进行聚类,能够根据其共享的生物学特性将这些疾病联系起来,从而重新审视疾病的类别和亚型。例如,各种痴呆亚型被划分到同一疾病亚群,该亚群还包含精神、内分泌、心血管等系统疾病,基于此,研究团队进一步揭示了该亚群的特征性生物学功能,将生物学上相关的疾病联系在一起,有助于解释为何患者身上会同时出现看似不相关的症状,并进一步加深对机制的理解和提高治疗的有效性。
血浆高通量测序蛋白质数据存在复杂交互作用,往往难以单独处理,而人工智能算法,能够高效提取关键特征,构建精确预测/诊断模型。研究团队利用机器学习等人工智能大数据分析技术,识别出了具有潜在诊断和预测价值的生物标志物,发现基于蛋白质的模型在183种疾病中的AUC值超过0.80,明显优于基于人口统计学的模型,将有助于提高疾病的早期诊断率。
值得一提的是,GDF15被发现是预测和诊断多种疾病的关键蛋白,其在对200种疾病的预测中的重要度均排名第一,这表明GDF15在疾病的早期识别和风险评估中具有重要作用,可能成为一个重要的生物标志物。此外,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多个疾病中表现出良好的预测和诊断性能,表明它们在多种生物过程中发挥着核心作用,具有广泛的临床应用潜力。
对历史药物开发项目数据的评估显示,有遗传证据支持的靶点-适应症对在药物开发中更有可能获得成功。该研究通过整合蛋白质数量性状位点(pQTL)和疾病全基因组关联研究(GWAS)数据,使用孟德尔随机化分析(MR)确定了474个具有潜在因果关联的蛋白质-疾病对。通过检索DrugBank和Therapeutic Target Database中的药物靶点信息以及进行安全性评估,该研究提供了对25个已知靶点的37种潜在药物重新利用机会,并确立了26个具有治疗潜力且安全性良好的新靶点,为老药新用和新药开发提供了重要线索。
为了进一步推动科学研究和精准医疗的发展,该研究建立了一个可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。这个数据库不仅有助于科学家们更好地理解疾病的生物学机制,还将加速疾病生物标志物、预测诊断模型和治疗靶点的开发,为精准医学的实施提供强有力的支持。
Proteome-Phenome Atlas数据库首页
总的来说,这项研究绘制的人类健康与疾病蛋白质组图谱揭示了血浆蛋白在疾病诊断、预测和治疗中的潜在应用价值。研究为临床实践提供了科学依据,有助于疾病的早期检测、精准分层和个性化治疗。未来,基于这一开放获取的蛋白质组学图谱,研究人员将能够更深入地探索疾病发病机制,推动生物标志物和预测/诊断模型开发,并探寻全新治疗靶点,为精准医学发展奠定了基础。
论文链接:
https://www.cell.com/cell/fulltext/S0092-8674(24)01268-6
助力医学研究高质量发展,推动医疗科技创新转化!
基础方案设计|数据挖掘|数据分析
来源:谈理说科学