Lancet子刊!MIMIC心电图数据拿下9.6分,机器学习成最佳拍档!

360影视 日韩动漫 2025-05-26 15:22 2

摘要:MIMIC数据库发顶刊可不多见,今天这篇文章就做到了!学者挖掘MIMIC中的心电图数据,联合该数据库的常见搭档——机器学习,成功拿下柳叶刀子刊!一起看看吧!

引言

MIMIC数据库发顶刊可不多见,今天这篇文章就做到了!学者挖掘MIMIC中的心电图数据,联合该数据库的常见搭档——机器学习,成功拿下柳叶刀子刊!一起看看吧!

肝脏疾病每年导致约200万人死亡,但传统诊断方法(如血液检测、影像学检查和肝活检)常具有侵入性、成本高且敏感性不足,尤其在早期阶段。

先前研究发现,心电图(ECG)作为一种广泛可用、非侵入的工具,能够通过捕捉心血管与肝脏的相互作用,为肝脏疾病诊断提供新途径。

2025年6月,外国学者用两个独立数据集(MIMIC-IV-ECGECG-View II),在医学顶刊Lancet子刊(医学一区Top,IF=9.6)发表题为:Electrocardiogram-based diagnosis of liver diseases: an externally validated and explainable machine learning approach”的研究论文。

研究基于心血管与肝脏的生理关联(如肝硬化相关心肌病、门肺高压等双向病理机制),提出通过ECG特征(如QTc间期、RR间期)和人口统计学数据构建机器学习模型,预测特定的肝脏疾病(如酒精性肝病、肝衰竭)

研究团队通过基于树的机器学习模型——XGBoost,探究ECG与肝脏疾病的潜在关联,并结合Shapley值增强模型可解释性。

训练和验证模型的数据来源于两个大型公开数据集:

MIMIC-IV-ECG来自美国波士顿医疗中心的急诊和重症监护患者(467,729例,2008–2019年),用于训练和内部验证;

ECG-View II来自韩国三级医院的住院患者(775,535例,1994–2013年),用于外部验证。

这两数据集均通过分层抽样确保年龄、性别和诊断分布的平衡,避免患者重叠。

图1 研究流程图

研究结果显示,基于树的机器学习模型(XGBoost)对肝脏疾病具有较强的预测性能和较好的泛化性。例如:

酒精性肝病(K70)内部ROC曲线下面积(AUROC)为0.8025,外部为0.7644;其亚型(如K7030)在外部验证中表现更优(AUROC达0.8777);

肝衰竭(K72)内部AUROC为0.7404,外部为0.7498,性能略低但稳定性良好。

表1 比较内部(MIMIC-IV-ECG)和外部(ECG-View II)数据集中每种疾病的AUROC、敏感性、特异性和患病率

研究进一步通过Shapley值量化每个特征对模型预测的贡献,结果一致认为年龄和QTc间隔延长是关键的预测因素。

而性别(男性风险更高)、RR间期(低值或极高值)及T波轴异常也有显著贡献。

图2 可解释性结果

此外,模型在不同人口亚组(性别、年龄分位数)中表现稳定,但老年组性能略有下降,表明了上述研究结果的稳健性。

值得注意的是,女性的AUROC值始终高于男性,这意味着潜在的病理生理差异会影响模型的可预测性。

综上所述,心电图(ECG)结合可解释机器学习为肝脏疾病提供了一种高效、非侵入的筛查工具,尤其在资源有限场景下潜力显著。QTc间期等ECG特征可作为肝病的潜在生物标志物,支持早期发现和风险分层。


来源:郑老师讲统计

相关推荐