Hepatology丨复旦大学张铁军/陈兴栋团队研究基于机器学习的血浆代谢组学预测肝硬化的长期并发症

360影视 2024-12-27 13:58 3

摘要:2024年12月,复旦大学张铁军和陈兴栋共同通讯在Hepatology(IF=12.9)在线发表题为“Machine-learning–based plasma metabolomic profiles for predicting long-term com

iNature

肝硬化并发症通常发生在肝纤维化进展的长期无症状阶段,且通常在较晚阶段被诊断。

2024年12月,复旦大学张铁军和陈兴栋共同通讯在Hepatology(IF=12.9)在线发表题为“Machine-learning–based plasma metabolomic profiles for predicting long-term complications of cirrhosis”的研究论文。该研究纳入了64,005名UK生物库参与者,并分析了他们的代谢组学数据。

参与者随机分为训练组(n=43,734)和验证组(n=20,271)。肝硬化并发症被定义为因肝硬化住院或出现肝细胞癌(HCC)就诊。作者应用了一种可解释的机器学习框架,从168种循环代谢物中提取代谢状态,以在训练组中进行学习。随后,作者开发了一个整合性列线图,并与传统风险评分和遗传风险评分进行了比较。作者将参与者分为低风险、中风险和高风险三组,依据列线图选择的临界值。预测性能通过时间依赖的受试者工作特征曲线下面积(time-dependent AUC)、校准曲线和决策曲线分析进行了验证。代谢组学模型能够准确预测训练组中肝硬化并发症的10年风险(时间依赖AUC:0.84 [95% CI: 0.82–0.86]),并且优于纤维化-4指数(AUC差异:0.06 [0.03–0.10])和多基因风险评分(AUC差异:0.25 [0.21–0.29])。在验证组中,整合代谢状态、天冬氨酸转氨酶、血小板计数、腰围/臀围比和吸烟状态的列线图,分别在3年、5年和10年的时间依赖AUC为0.930、0.889和0.861。高风险组的风险比(HR)为43.58(95% CI: 27.08–70.12),与低风险组相比,风险显著增加。

慢性肝病(CLD)是一个重大公共卫生问题,每年导致全球超过一百万人的死亡。其中大部分死亡与肝硬化的并发症相关,如失代偿性肝硬化和肝细胞癌(HCC)。尽管由乙型和丙型肝炎病毒引起的肝硬化的患病率在全球范围内有所下降,但非酒精性脂肪性肝病(NAFLD)的患病率却在急剧上升,这是由于肥胖和2型糖尿病的流行。目前的共识是,肝脏疾病通常是可以预防和治疗的,只要能够正确实施精准的预防和早期检测措施。然而,肝硬化的诊断通常是在患者出现不可逆的并发症后才做出,因为肝病的可逆阶段往往是无症状的,容易被忽视。

在这种背景下,及早识别处于CLD风险中的个体,可以通过及时的治疗干预来预防肝硬化并发症的发生。与此同时,这需要权衡对绝大多数不会发展为肝硬化并发症的CLD患者可能带来的不必要干预(例如,侵入性肝脏活检和转诊至专科护理)。因此,风险分层在肝硬化并发症的预防中至关重要。然而,目前在普通人群中,可用于识别高风险发展为肝硬化并发症的人群的非侵入性工具较为稀缺。尽管一些常规的风险评分,如天冬氨酸转氨酶(AST)与血小板(PLT)比值指数(APRI)和纤维化-4指数(FIB-4),在预测肝硬化并发症的风险中显示出潜在的应用价值,但由于这些指数最初是为评估丙型肝炎病毒感染者的纤维化而设计的,因此它们对普通人群的预测准确性较为有限。

模式流程图(图片源自Hepatology

以前的研究表明,CLD的进展涉及代谢变化,而血液代谢组学的系统信息有可能提供有关肝硬化并发症风险的线索。值得注意的是,质子核磁共振(1H-NMR)谱学等检测方法近年来已经成熟,能够以相对较低的成本进行高通量的代谢组学评估。此外,与基于质谱的技术相比,NMR具有几乎不存在批次效应和对昂贵试剂的需求较少的优点,这也促进了其流行。与此同时,代谢组学信息在肝硬化并发症风险预测中的应用仍然不足。

研究旨在利用NMR基础的血浆代谢组学分析来预测肝硬化并发症的10年风险。作者训练了一种梯度增强树模型,用以学习高风险肝硬化个体的代谢状态。作者进一步开发并验证了一个有效的列线图评分系统,该系统将代谢状态、人口学和实验室信息整合起来,预测个体化的肝硬化并发症的发病风险。

原文链接:

来源:临床肝胆病杂志一点号

相关推荐