摘要:作为临床关注的重点问题,HR+/HER2− 乳腺癌的复发是一个持续的过程,其每年的远端复发率保持在 1%。多达 20% 的 HR+/HER2− 乳腺癌患者因内分泌耐药机制而出现复发性转移。即使经过 5 - 10 年的标准内分泌治疗,复发仍持续不断。因此,迫切需
编辑丨王多鱼
排版丨水成文
乳腺癌是女性中最常见的癌症, 激素受体阳性(HR+)/人表皮生长因子受体 2 阴性 (HER2−) 乳腺癌是主要亚型,占据了乳腺癌的 65%-70%。
作为临床关注的重点问题,HR+/HER2− 乳腺癌的复发是一个持续的过程,其每年的远端复发率保持在 1%。多达 20% 的 HR+/HER2− 乳腺癌患者因内分泌耐药机制而出现复发性转移。即使经过 5 - 10 年的标准内分泌治疗,复发仍持续不断。因此,迫切需要预测 HR+/HER2− 乳腺癌患者复发的风险。
2025 年 1 月 22 日,复旦大学附属肿瘤医院肖毅副研究员、邵志敏教授、江一舟教授等人在 Cell 子刊Cell Reports Medicine上发表了题为:Multimodal integration using a machine learning approach facilitates risk stratification in HR+/HER2- breast cancer 的研究论文。
该研究基于大样本 HR+/HER2- 乳腺癌多组学队列,整合基线临床数据,多维度免疫组化、代谢组、病理组、转录组、基因组和拷贝数变异信息,构建了多模态机器学习预测模型——CIMPTGV,为精准预测 HR+/HER2- 乳腺癌复发风险提供了创新性解决方案。
生物标志物发现、多组学技术和预后预测模型优化方面的进展,使得预测癌症治疗的耐药性和复发风险成为可能。 基因表达谱分析,例如 Oncotype DX 检测和 MammaPrint,为将乳腺癌患者分为低风险和高风险组提供了策略,并有助于识别早期 ER+ 乳腺癌患者中可能从化疗中获益的人群。
然而,这些预测标志物在某些情况下存在局限性,这种局限性在一定程度上归因于主要依赖临床病理或转录组学数据,这些数据无法全面捕捉癌症的复杂性。
随着测序技术的进步和成本的降低,包括基因组、转录组、蛋白质组、代谢组和表观基因组在内的多组学数据变得越来越容易获取。此外,人工智能(AI)技术的出现促进了来自多模态的数据的整合。
近年来,多模态机器学习已被用于治疗效果预测、术后分层和预后评估,展现出其相当大的实用价值。多模态的整合能够从各个方向全面了解肿瘤特征,而机器学习方法能够将这些数据转化为先进的预后模型。然而,由于数据收集、队列建立以及整合方法等方面的问题,多种组学类型的整合仍然具有挑战性。其在乳腺癌中的应用也仍待进一步探索。
在这项研究中,研究团队利用包含 579 名 HR+/HER2- 乳腺癌患者的多组学信息的队列,构建了一个机器学习框架,并生成了一个名为CIMPTGV的多模态模型,该模型整合了临床信息( C linical information)、免疫组化( I mmunohistochemistry)、代谢组学( M etabolomics)、病理组学( P athomics)、转录组学( T ranscriptomics)、基因组学( G enomics)和拷贝数变异(Copy Number V ariations),以预测 HR+/HER2- 乳腺癌的复发风险。
CIMPTGV 模型在预测复发风险方面表现出色,其在训练集和测试集上的一致性指数(C指数)分别为 0.871 和 0.869。可准确预测74.2%的复发患者和85.8%的未复发患者。该模型的预测效果优于常规临床病理指标,且在不同临床亚组间均可显著区分高低危复发风险患者。值得注意的是,同源重组缺陷(HRD)评分与 CIMPTGV 风险评分呈显著正相关。特征分析揭示了不同模态之间的协同效应和互补效应,这有助于 CIMPTGV 模型获得较高的 C 指数。
为了促进临床应用,研究团队还开发了 CIMPTGV 模型的简化版,这种简化的模型在临床环境中优于常见的模态组合,平均曲线下面积(AUC)为 0.840,有望改善 HR+/HER2- 乳腺癌复发的预测,有助于识别高危患者,并通过个性化治疗策略改善其预后。
该研究的亮点:
CIMPTGV 模型是一种由机器学习方法生成的多模态模型;
CIMPTGV 模型能够预测 HR+/HER2- 乳腺癌患者的复发;
协同作用和互补作用增强了 CIMPTGV 模型的效果;
一个简化的 CIMPTGV 模型平衡了效率、减少了数据收集成本
论文链接:
https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(24)00695-5
来源:科学老丁