摘要:本研究开发了iMLGAM,这是一个新型的跨癌症免疫治疗应答预测系统。研究不仅揭示了低评分组具有更丰富的免疫细胞浸润和更强的抗肿瘤免疫反应,还发现CEP55是调节肿瘤免疫逃逸的关键分子。
iMLGAM:基于机器学习和遗传算法的多组学整合分析用于泛癌免疫治疗反应预测
iMeta主页:http://www.imeta.science
研究论文
● 原文: iMeta (IF 23.8)
● 原文链接:
https://onlinelibrary.wiley.com/doi/full/10.1002/imt2.70011●
DOI: https://doi.org/10.1002/imt2.70011● 2025年3月8日,东南大学叶必成和天津医科大学张朋朋等在iMeta在线发表了题为“
iMLGAM: integrated Machine Learning and Genetic Algorithm-driven Multiomics analysis for pan-cancer immunotherapy response prediction”的文章。●
本研究开发了iMLGAM,这是一个新型的跨癌症免疫治疗应答预测系统。研究不仅揭示了低评分组具有更丰富的免疫细胞浸润和更强的抗肿瘤免疫反应,还发现CEP55是调节肿瘤免疫逃逸的关键分子。● 第一作者:叶必成、范骏、薛磊、庄宇
● 通讯作者:张朋朋 (zpp19940120@tmu.edu.cn)、林浩然(linhaoran@jsph.org.cn)、任传利(18051061089@yzu.edu.cn)、周文航(huaianzhouwenhang@163.com)
●
主要单位:东南大学医学院、南京医科大学第一附属医院、南京市胸科医院、南京医科大学附属脑科医院、天津医科大学肿瘤医院、徐州医科大学附属淮安医院、扬州大学附属苏北人民医院亮 点
● 开发了iMLGAM,这是一个整合机器学习和遗传算法的多组学分析软件包,专门用于免疫治疗反应预测;
● iMLGAM评分系统在跨多个队列中预测免疫检查点抑制剂(ICB)治疗结果方面展现出卓越的性能;
● 低iMLGAM评分与增强的免疫细胞浸润和抗肿瘤反应相关;
● CEP55被鉴定为T细胞介导的抗肿瘤免疫和免疫检查点抑制剂疗效的关键调节因子。
摘 要
为了解决免疫检查点阻断(ICB)治疗效果的显著差异性,我们开发了一个创新的R软件包,称为集成机器学习和遗传算法驱动的多组学分析(iMLGAM),该系统通过先进的多组学数据整合建立了一个全面的治疗效果预测评分系统。我们的研究表明,iMLGAM评分在独立队列中展现出优异的预测性能,较低的评分与更好的治疗反应显著相关,且优于现有的临床生物标志物。详细分析揭示,低iMLGAM评分的肿瘤具有独特的免疫微环境特征,包括增加的免疫细胞浸润和增强的抗肿瘤免疫应答。重要的是,通过CRISPR筛选,我们发现中心体蛋白55(CEP55)是调控肿瘤免疫逃逸的关键分子,机制研究证实了其在调节T细胞介导的抗肿瘤免疫应答中的作用。这些发现不仅验证了iMLGAM作为强大预后工具的价值,还提出了CEP55作为潜在治疗靶点的可能性,为提高ICB治疗效果提供了新的策略。iMLGAM软件包可在GitHub(https://github.com/Yelab1994/iMLGAM)上免费获取,为研究人员提供了个体化癌症免疫治疗预测的创新方法。
视频解读
Bilibili:https://www.bilibili.com/video/BV1BtRYYNEMt/
Youtube:https://youtu.be/8PmDAyj87lo
中文翻译、PPT、中/英文视频解读等扩展资料下载
请访问期刊官网:http://www.imeta.science/
全文解读
引 言
免疫检查点阻断疗法(ICB)的引入彻底改变了癌症治疗的格局,显著改善了患者的生存预后。然而,ICB并非适用于所有癌症患者的通用解决方案。尽管在某些肿瘤类型(如黑色素瘤、非小细胞肺癌和肾细胞癌)中取得了令人鼓舞的治疗效果,但在其他肿瘤类型(如结直肠癌、胰腺癌和前列腺癌)中,ICB的反应率较低,这凸显了个性化治疗的重要性。在美国,ICB的使用率显著上升,从2011年的1.54%增至2018年的43.63%,但其临床疗效仍然有限,仅有约12.46%的治疗患者表现出良好的反应。不同恶性肿瘤和个体病例的治疗效果存在显著差异,这表明需要更精准的预测标志物来筛选适合ICB治疗的患者。目前,多种炎症相关评分被研究作为ICB治疗反应的潜在预测因子,包括肿瘤浸润淋巴细胞(TILs)、肿瘤突变负荷(TMB)、免疫评分(Immunoscore)以及胃肠道肿瘤微生物组评分。然而,这些生物标志物的预测价值有限,且尚未有一种普遍适用的预测标志物能够准确预测不同癌症类型对ICB的反应。这种局限性不仅阻碍了实施免疫治疗患者的管理,也限制了联合治疗策略的进一步发展。
肿瘤免疫微环境(TIME)由多种免疫细胞组成,对ICB的疗效有显著影响。明确TIME特征与ICB治疗效果的关系,对于优化患者分层和治疗干预至关重要。然而,免疫细胞间的复杂相互作用可能导致矛盾的解释,凸显了对更先进分析方法的需求。传统技术如免疫组织化学(IHC)和流式细胞术常用于TIME检测,但在同时评估多种细胞标志物时存在局限性。单细胞RNA测序(scRNA-seq)虽能提供高分辨率的转录组分析,但其临床应用受限于成本和样本要求。相比之下,批量RNA测序(bulk RNA-seq)对次优样本更具适应性,且能从异质性组织中生成全面的转录谱。因此,通过bulk RNA-seq研究免疫相关基因表达已成为TIME表征的可靠方法。
在转录组数据分析领域,集成学习方法已被证明比单一机器学习方法具有更高的预测准确性。然而,该领域仍面临一些技术挑战,包括过拟合风险、测序平台异质性处理以及缺乏用于基础学习器识别的自动化流程。为克服这些局限性,本研究开发了一种基于集成机器学习和遗传算法的多组学分析工具(iMLGAM),并构建了一个新颖的评分系统,用于预测接受ICB治疗的癌症患者的结局。该工具以R包形式实现,整合了多个关键流程:通过基因配对降低批次效应、利用自适应最佳子集选择(ABESS)算法进行特征优化,以及采用遗传算法(GA)实现基础学习器的自动化优化。这一方法旨在建立一个更稳健且适应性强的ICB治疗应答预测系统,对提升癌症免疫治疗的效果和制定临床策略具有潜在意义。
结 果
iMLGAM评分的开发
为了开发iMLGAM评分系统,本研究实施了一个综合的机器学习工作流程,整合了多种算法方法。iMLGAM评分的构建过程完全在训练队列中进行。首先对训练集进行减少批次效应处理,生成了187,953个免疫相关基因对(IRGPs)。通过多变量逻辑回归(调整癌症类型,p 0.6),本研究在训练队列中识别出2,537个关键IRGPs(表S1)。随后,使用ABESS算法从2,537个关键IRGPs中筛选出五个基因对,分别是BMP2|SELE、CD274|SH3TC1、CHST15|LAG3、CKLF|TLR7以及ESCO2|RXRA,这些基因对被用作构建iMLGAM评分的基础特征。为了进一步提升预测性能,本研究采用了四种不同的机器学习算法:弹性网络(Enet)、随机森林(RF)、支持向量机(SVM)和K近邻(KNN)。通过10折交叉验证和网格搜索进行参数优化,生成了50个基础学习器(m1–m50)用于后续分析(表S2)。这些基础学习器通过堆叠策略集成,构建了iMLGAM评分。为了简化传统的手动优化过程,本研究引入了GA以提高集成模型的准确性。优化后的iMLGAM评分纳入了十个模型:m3、m5、m6、m16、m19、m23、m24、m29、m40和m46。这一优化后的集成模型展示了显著的算法多样性,包括三个Enet模型(m3、m5、m6)、两个KNN模型(m40、m46)、两个RF模型(m16、m19)和三个SVM模型(m23、m24、m29),验证了GA在模型选择中的有效性(图1A)。
iMLGAM评分的评估
为了进一步评估iMLGAM评分在预测临床反应中的有效性,本研究将其应用于训练、验证和测试队列。该评分在所有三个队列中有效地区分了应答组和非应答组,较低的评分表明患者更有可能从ICB治疗中获益(all ppp
iMLGAM评分与其他特征的比较及网络工具开发
最近,测序技术和机器学习的进步推动了免疫治疗反应预测特征的开发。这些特征基于不同的生物学特性和分子类型,已显示出对ICB治疗的预测价值。本研究系统评估了12个已发表的特征,并将其与iMLGAM评分进行比较,发现iMLGAM评分在训练、测试和验证队列中的预测性能始终优于其他特征(图1H-J)。利用Mariathasan、Braun、OAK和Riaz队列中较为全面的数据,本研究进行了ROC曲线分析,比较了iMLGAM评分与PD-L1表达和TMB的表现。结果显示,iMLGAM评分在这些队列中始终优于PD-L1和TMB(图S3A-D)。多变量Logistic回归分析进一步确立了iMLGAM评分作为临床反应的独立预测因子(all p
图1. iMLGAM评分的开发与验证,用于预测免疫治疗反应
(A)综合流程图详细描述了训练、验证和测试iMLGAM评分的系统过程。 (B-D iMLGAM评分的显示了免疫治疗反应者与非反应者之间的明显差异,涵盖了训练、验证和独立测试队列,揭示了该评分在治疗反应分层中的潜力。(E-G) 受试者工作特征(ROC)曲线展示了iMLGAM评分在识别潜在免疫治疗益处方面的预测准确性。(H-J)将iMLGAM评分与现有已发表的分子特征进行比较,通过ROC-AUC指标进行评估,展示了这一方法在多个独立数据集中的优秀的预测能力。
综合免疫景观分析
为了进一步探讨免疫景观与iMLGAM评分之间的关系,本研究对癌症基因组图谱(TCGA)队列进行了多组学分析。通过训练队列的公式和阈值,将TCGA队列分为高和低iMLGAM评分组(图S4A)。基因组分析显示,低iMLGAM评分组的白细胞、淋巴细胞和TILs比例显著更高(ppppppadjust ppp
图2. iMLGAM评分与不同的免疫特征和分子通路相关
(A)iMLGAM评分网页工具的页面。(B)火山图分析显示高iMLGAM评分组与低iMLGAM评分组之间29种免疫特征的差异富集情况。红色点表示在肿瘤组织中富集的特征,蓝色点表示在正常组织中富集的特征。(C)通过基因集富集分析(GSEA)比较高iMLGAM评分组与低iMLGAM评分组之间的分子通路。(D)29种免疫特征的相关性矩阵的可视化。
肿瘤免疫原性的分子和基因组决定因素
本研究首先比较了低和高iMLGAM评分组之间肿瘤免疫原性的关键决定因素。低iMLGAM评分组表现出更高的突变率和新抗原负担(pppppppp
与iMLGAM评分组相关的拷贝数特征
高、低iMLGAM评分组之间观察到显著的染色体畸变差异(图S7A)。其中,低iMLGAM评分组在9p24.1位点的PD-L1和PD-L2等免疫基因呈现局部扩增,而高iMLGAM评分组未发现类似现象(图S7B和C)。通过维恩图分析,研究识别出319个共享于扩增染色体区域的基因,其中217个为高iMLGAM评分组特有,1,225个为低iMLGAM评分组特有(图S7D)。基因本体注释分析显示,低iMLGAM评分组的独特扩增基因显著富集于免疫相关过程,尤其是"T细胞共刺激"和"B细胞增殖"(图S7E);而高iMLGAM评分组则主要富集于"成纤维细胞增殖的调节",未发现免疫相关过程的富集。这一发现与前期研究结果一致:低iMLGAM评分组免疫细胞数量增加,而高iMLGAM评分组成纤维细胞水平较高。值得注意的是,位于低iMLGAM评分组特有的9p24.1扩增峰内的PD-L1和PD-L2与免疫相关生物过程存在关联,提示其在免疫状态调节中的潜在作用(图S7F)。基于TCGA队列的mRNA表达分析进一步证实,低iMLGAM评分组中PD-L1和PD-L2的表达水平显著升高(图S7G),与先前的拷贝数变异(CNV)结果相吻合。这些发现表明,肿瘤特异性的拷贝数变异可能是导致免疫浸润模式差异的重要因素。
在独立临床队列中验证iMLGAM评分的预测价值
本研究采用多重免疫荧光染色技术对非小细胞肺癌患者的组织样本进行分析,检测指标包括DAPI、CD4、CD8和CD20。结果表明,低iMLGAM评分组中CD8+T细胞和B淋巴细胞的浸润程度显著高于高iMLGAM评分组(图3A,图S8A-B)。基于RECIST标准,研究对患者免疫治疗后的影像学反应进行了评估(图3B)。通过ROC分析验证了iMLGAM评分对新辅助免疫治疗结果的预测效能,其AUC值达到0.73,显示出良好的预测能力(图3C和D)。值得注意的是,尽管反应者组中低iMLGAM评分病例占比较高(图3E),但这一差异未达到统计学显著性(p= 0.09),这可能与样本量较小(n = 14)有关。图3. 自测队列中iMLGAM评分的验证
(A)高iMLGAM评分组和低iMLGAM评分组的代表性多重免疫荧光图像,显示DAPI、CD4、CD8和CD20的染色情况。(B)高iMLGAM评分组与低iMLGAM评分组的影像学评估,比较免疫治疗前后的影像学变化。(C)自测队列的基线临床特征。(D)iMLGAM评分在自测队列中用于预测临床反应的ROC曲线分析。(E)应答组与非应答组之间iMLGAM评分的分布。
治疗靶点的识别
本研究系统分析了来自七个CRISPR队列的免疫反应数据,涵盖22,505个基因,这些基因依据细胞类型和治疗条件被划分为17个数据集。通过平均z分数对基因进行排序,结果显示免疫耐受基因位于排序顶端,而免疫敏感基因位于底端。研究表明,敲除免疫耐受基因可能增强抗肿瘤免疫,而破坏免疫敏感基因则可能削弱免疫反应。随后,研究对包含整合训练、验证和测试集的元队列进行单变量Cox回归分析,识别出与高iMLGAM评分显著相关的预后基因(pp
CEP55敲低减弱癌细胞恶性表型
为探究CEP55在癌细胞恶性表型中的作用,研究分别使用对照短发夹RNA(shNC)和CEP55靶向shRNA(shCEP55-1,shCEP55-2)转染肿瘤细胞(图S10A)。Transwell迁移和侵袭实验结果表明,CEP55敲低显著抑制了结肠肿瘤26(CT26)和Lewis肺癌细胞系(3LL)的迁移和侵袭能力(ppp
图4. 基于iMLGAM评分的CEP55基因的成簇规律间隔短回文重复序列(CRISPR)筛选及功能分析
(A)通过17个CRISPR数据集筛选出的具有抗肿瘤免疫敲除效应的基因排名。(B)高iMLGAM评分预后基因的单变量Cox回归分析,CEP55为CRISPR筛选数据中的首选候选基因。(C-D) 使用Transwell实验评估CEP55敲低后CT26(C)和3LL(D)细胞的迁移和侵袭能力。(E)克隆形成实验显示CEP55敲低后癌细胞增殖受到抑制。(F)流式细胞术分析CEP55敲低后CT26和3LL细胞中凋亡细胞的比例。
通过与CT26和3LL癌细胞的共培养系统,探索了CEP55敲低对CD8+T细胞免疫功能的影响。肿瘤细胞被转染了非靶向对照shNC或CEP55靶向shRNA,并与CD8+T细胞共培养。结果显示,与对照组相比,CEP55敲低组中IFN-γ+CD8+T细胞的百分比显著增加(p+CD8+T细胞的百分比在CEP55敲低后也显著升高(p+T细胞上耗竭标记物PD-1和TIM-3的表达,表明CEP55表达的减少可能逆转T细胞的耗竭并恢复其功能(pp< 0.05)(图5G)。这些发现表明,靶向CEP55可能增强免疫治疗的疗效。图5. CEP55敲低对CD8⁺ T细胞活性及肿瘤生长的影响
(A) 在CT26/3LL共培养系统中,转染shNC或shCEP55后,通过流式细胞术分析IFN-γ⁺ CD8⁺ T细胞。(B)在CT26和3LL共培养系统中,IFN-γ⁺ CD8⁺ T细胞的定量分析。(C)在共培养系统中,TNF-α⁺ CD8⁺ T细胞的定量分析。(D)在CT26和3LL共培养系统中,TNF-α⁺ CD8⁺ T细胞的定量分析。(E)在shNC、shCEP55和shCEP55+抗PD-1治疗下,3LL荷瘤小鼠模型的肿瘤图像。(F) 在3LL模型中,不同治疗组的肿瘤重量比较。(G)在shNC、shCEP55和抗PD-1治疗下,3LL荷瘤小鼠的Kaplan-Meier生存分析。(H)在3LL模型中,不同治疗组的肿瘤生长曲线(mm³)。
讨 论
识别可靠的预测生物标志物对于免疫治疗中的治疗决策、资源分配优化以及加速临床研究和监管批准至关重要。尽管之前已经研究并实施了多种生物指标用于免疫治疗结果预测,但其预测能力被发现不足。这些局限性强调了寻找替代反应特征的迫切需求。在本研究中,本研究基于1242名肿瘤患者的测序数据开发并验证了iMLGAM评分,用于评估接受免疫检查点抑制(ICB)治疗患者的临床结局。本研究首次构建了一种泛癌免疫治疗预测评分系统,该系统创新性地整合了集成学习、基因对分析以及遗传算法(GA)方法,为精准预测免疫治疗疗效提供了新的策略和工具。
本研究在多个方面展现了创新性和临床应用价值。首先,研究涵盖了多种主要肿瘤类型,包括非小细胞肺癌、黑色素瘤和肾细胞癌。这些癌症类型是目前临床实践中接受ICB治疗的主要对象。其次,尽管已有多种基于mRNA的指标被提出作为潜在的免疫治疗反应预测因子,但在临床环境中实施多生物标志物预测系统时,仍需全面评估影响高通量检测精度的多种因素。其中,关键的考虑因素包括前分析(样本来源)和技术(平台来源)的变异。尽管组织特异性mRNA表达的变异通常可以通过引入参考基因和相对定量协议进行标准化处理,但这些mRNA特征的风险评分算法和阈值在不同分析平台之间的兼容性较差,从而限制了其在临床中的广泛应用。
为克服上述局限性,本研究引入了IRGPs方法,有效消除了批次效应带来的变异。既往研究表明,基因对分析方法(例如PD-L1与CXCL10基因对)能够提供更为精准的预后评估。尽管PD-L1和CXCL10单独分析时均与良好预后相关,但两者的基因对组合实际上与显著缩短的生存期相关。这一发现源于免疫细胞复杂的相互作用网络,凸显了传统单基因分析方法的不足。相比之下,基于基因对的分析方法不仅增强了集成学习模型的性能,还带来了多重优势:减少了因免疫细胞共浸润引起的预后偏差,能够捕捉相对免疫细胞丰度的模式,并为癌症进展机制的理解提供了更深入的见解。此外,基于基因对的预测系统在多种测序平台和样本类型中展现出更高的稳定性,具有更强的转化潜力。该方法能够检测到细微的免疫细胞变化,同时对技术表达测量的波动保持较强的抵抗力,相较于单基因表达分析,展现出更高的稳健性、生物学解释能力和临床实用性,尤其是在TIME研究中。此外,GA的引入优化了集成框架内基础学习者的筛选,进一步提高了预测的准确性。这种综合分析方法不仅在治疗反应预测方面表现出色,还具备多功能性,能够扩展到包括基因表达和临床数据在内的多种分析应用,涵盖泛癌预后评估等多个领域。最后,iMLGAM评分系统呈现出显著的临床优势。这一方法可能保护非应答个体免受免疫相关并发症的影响,同时促进快速转向替代治疗策略。考虑到平均治疗费用为120,000美元,实施精确的生物标志物策略可能为预测疗效有限的干预措施带来可观的成本降低。
本研究对TCGA数据库进行了全面分析,以表征不同肿瘤的免疫治疗反应模式。分析表明,iMLGAM评分较低的样本表现出炎症性免疫学特征,具体表现为CD8⁺ T淋巴细胞浸润增加和免疫原性升高。通过应用Danaher等人建立的免疫浸润参数和单样本基因集富集分析(ssGSEA)分析,低iMLGAM评分队列中表现为显著增加的免疫细胞浸润,验证了其强大的抗肿瘤免疫活性。既往研究已建立TILs密度与多种癌症类型的免疫反应之间的正相关关系。低iMLGAM评分人群不仅显示出增强的细胞毒性T细胞存在,还显示出免疫检查点分子(包括PD-L1、PD-1和CTLA-4)表达的增加,与高iMLGAM评分组相比。这种激活的抗肿瘤免疫、上调的检查点分子表达和增强的肿瘤免疫原性可能是低iMLGAM评分患者在ICB治疗中表现出优越反应的基础。
为了充分发挥iMLGAM评分的强大预测能力,本研究通过分析CRISPR数据集,筛选出与免疫治疗反应相关的分子靶点。随后,对元队列进行单变量Cox回归分析,以识别与高iMLGAM评分相关的预后标志物,最终锁定CEP55作为重点研究对象。CEP55是中心体蛋白家族的重要成员,参与调节有丝分裂过程和细胞质分裂。其核心功能包括微管锚定、蛋白质聚合促进以及纺锤体组装调节,从而调控细胞增殖。研究表明,CEP55在多种恶性肿瘤中显著上调,并通过与PI3K p110催化亚基直接相互作用,激活PI3K/AKT通路。这种激活作用促进了细胞转化、增殖、上皮-间质转化和转移潜力,加速了肿瘤进展。此外,早期的功能基因组筛选研究在182个基因中识别出CEP55,其修饰可影响肿瘤对T细胞介导细胞毒性的敏感性。在结直肠癌中,CEP55的高表达与免疫排斥和疾病进展相关,而其抑制则增强了抗肿瘤免疫和免疫检查点抑制剂(ICB)的治疗反应。本研究的研究进一步表明,CEP55的下调显著削弱了恶性细胞的表型特征,并增强了免疫治疗的疗效。
本研究存在以下局限性。首先,分析的11个RNA-Seq队列仅涵盖六种癌症类型,范围较为有限。因此,iMLGAM评分在泛癌免疫治疗反应预测中的效能仍需通过前瞻性ICB临床试验进一步验证。其次,部分数据集缺乏关键的临床注释信息,这在一定程度上限制了全面的生物标志物分析评估及比较。第三,本研究主要集中在验证CEP55在肺癌和结肠癌中的功能,而缺乏在其他癌症类型中的广泛验证。第四,尚未开展大规模、多中心的泛癌队列验证研究,这在一定程度上限制了模型的普遍适用性。第五,本研究未能充分阐明CEP55调节PD-L1表达的精确分子机制,尤其是相关的信号转导通路和转录调控机制仍未完全明确。未来的研究需要深入进行蛋白质相互作用分析和信号通路研究,以揭示CEP55调节PD-L1及其免疫反应的分子机制。
结 论
iMLGAM评分作为一种新兴的预测工具,展示了在评估接受免疫检查点抑制剂(ICB)治疗的癌症患者临床结果方面的显著价值。通过结合基因配对方法和先进的机器学习算法,iMLGAM评分系统在预测准确性上超越了现有的生物标志物。低iMLGAM评分与有利的免疫激活模式相关,表现为增强的抗肿瘤免疫反应,而高评分则指示免疫逃逸机制的存在。此外,通过全面分析,本研究进一步确定了CEP55作为一个有前景的治疗靶点。CEP55的敲低显著增强了ICB治疗的反应,这一发现为癌症治疗提供了新的策略。
方 法
数据收集与处理
本研究分析了来自11个RNA-Seq数据集的免疫治疗患者转录组和临床数据。这一数据集包括四个黑色素瘤队列(Łuksza、Gide、Riaz 和Hugo队列)、一个肾细胞癌数据集(Bruan队列)、一个尿路上皮癌研究(Mariathasan队列)、一个胶质母细胞瘤队列(Zhao队列)、一个胃癌数据集(Kim队列),以及两个非小细胞肺癌队列(OAK和POPLAR)。Hugo队列包含来自26名个体的27个治疗前肿瘤样本,而Zhao队列包括来自17名患者的34个治疗前样本;为保持数据独立性,本研究从这些数据集中随机选择每位患者的一个肿瘤样本。
本研究将六个ICB RNA-Seq队列合并,创建了一个大型数据集(n = 1031),其中包括肾细胞癌(n = 172)、尿路上皮癌(n = 298)、黑色素瘤(n = 244)和非小细胞肺癌(n = 317),合并了Braun、Mariathasan、Łuksza、Gide、Riaz和OAK队列。该数据集被分为训练集(70%,n = 722)和测试集(30%,n = 309)。其余五个ICB RNA-Seq队列被整合为一个独立的验证集(n = 211),详细信息见表S3。为了比较转录组特征,本研究使用sva R包中的ComBat函数来调整批次效应。
此外,本研究从UCSC Xena数据库(https://xenabrowser.net)获取了来自30个TCGA队列的9815名患者的标准化转录组和基因组数据,且这些患者具有完整的生存信息(表S4)。由于其高内源性免疫细胞含量,弥漫性大B细胞淋巴瘤、急性髓系白血病和胸腺瘤这三种癌症类型被排除在外。
本研究还纳入了一项泛癌症scRNA-seq研究的数据,该研究包括来自31个正常组织、54个邻近组织和148个肿瘤的样本。本研究使用Seurat R包处理了829,521个细胞,采用LogNormalize方法标准化基因表达数据,并识别出2000个变异性最大的基因进行主成分分析(PCA)。批次效应通过Harmony R包进行管理。分析流程包括关键步骤,如NormalizeData、FindVariableFeatures、ScaleData、RunPCA、FindNeighbors、FindClusters和RunUMAP。为了确保对细胞景观的全面分析,个体细胞注释来自原始研究。
免疫相关基因的数据来源于ImmPort数据库(https://immport.niaid.nih.gov)和TimiGP R包(表S5)。
临床标本收集与RNA测序
本研究建立了一个内部免疫检查点抑制(ICB)队列,包含14名被诊断为转移性或晚期非小细胞肺癌(NSCLC)的患者。这些患者在2018年1月至2022年10月期间接受了抗PD-1/PD-L1抗体的治疗,治疗方式包括单药治疗或与抗CTLA-4抗体联合使用。在ICB治疗前,收集NSCLC组织样本的伦理批准已获得长海医院医学伦理委员会的批准。随后,这些样本被送往中国苏州的Oncocare Inc.进行RNA测序。
临床结果
主要临床评估终点为客观反应率(ORR)和OS。ORR的确定基于实体肿瘤反应评估标准(RECIST)v1.1指南,而Hugo队列则使用免疫相关RECIST(irRECIST)标准进行评估。患者被分为两类:应答者,定义为达到完全反应(CR)或部分反应(PR)的患者;非应答者则包括稳定疾病(SD)或进展疾病(PD)的个体。
多色荧光免疫组化协议
本研究使用Akoya OPAL Polaris 4-Color Manual IHC Kit(NEL811001KT)对组织标本进行多色免疫荧光染色。该协议首先通过烘烤组织切片以促进附着,然后进行脱蜡以去除石蜡。通过加热切片进行抗原修复,并进行非特异性抗体相互作用的封闭。随后,切片与主要抗体孵育:CD4(1:500,Cat# ab133616,Abcam,USA)、CD8A(1:2000,Cat# ab217344,Abcam,USA)和CD20(1:100,Cat# ab64088,Abcam,USA)。接下来,进行HRP标记的二级抗体孵育。通过酪胺信号放大(TSA)实现每种抗原的信号放大,细胞核用DAPI进行对比染色。染色过程以覆盖玻片的安装结束,以便进行显微镜分析,从而实现对组织标本中细胞和分子结构的详细可视化。
评估iMLGAM评分与其他预测基因特征的比较
为了进一步评估iMLGAM评分的预测能力,本研究进行了与先前报告的免疫检查点抑制特征的比较分析。此次比较涵盖了12个不同的特征,包括:CAF特征、INFγ特征、chemokines特征、Davoli_IS特征、CEP特征、CYT特征、TLS特征、TIDE特征、NLPR3特征、Roh_IS特征、Ayers_expIS特征和IPS特征。这项全面的比较旨在确定iMLGAM评分在现有转录组评分中的相对有效性。
评估肿瘤免疫浸润使用CIBERSORT
CIBERSORT是一种去卷积算法,利用基因表达数据和支持向量回归来估计混合细胞肿瘤样本中不同细胞类型的比例。该方法基于标准化的基因表达谱推断22种浸润免疫细胞类型的相对丰度。
TILs和白细胞的浸润模式
在TCGA队列中,通过两种方法评估TILs水平:基因组评估和H&E染色图像分析。使用Thorsson等人和Saltz等人的研究进行这些评估。Saltz等人提供了超过5000个TCGA H&E染色全切片图像的广泛TIL映射,利用深度学习技术和卷积神经网络(CNN)对淋巴细胞进行分类,从而建立了TILs分析的基准。TIL分数的基因组评估结合了两个组成部分:(1)通过CIBERSORT确定的淋巴细胞总比例;(2)来自DNA甲基化的白细胞分数。总体而言,这种方法使得对TCGA数据集中不同癌症类型的TILs进行全面评估成为可能。
评估肿瘤免疫浸润评分
免疫浸润评分来源于Danaher等人进行的先前TCGA泛癌症研究。这些评分基于60个特定标记基因和ssGSEA方法,计算14种不同的免疫细胞群体的评分。每种免疫细胞类型的评分是根据这些标记基因的表达水平确定的。
免疫特征的表征
本研究从He等人的研究中获取了29个经典免疫特征。为了量化这些特征在每个样本中的富集水平,本研究利用GSVA R包,采用ssGSEA方法。
使用MCPcounter评估成纤维细胞的丰度
成纤维细胞的丰度通过MCPcounter算法进行估算,该算法通过MCPcounter R包实现。该算法提供了一种可靠的方法,用于利用转录组数据量化各种组织中的免疫和基质细胞群体。
免疫基因组指标的表征
免疫基因组指标来源于Thorsson等人的泛癌免疫景观研究。ITH评分定义为亚克隆基因组分数,通过ABSOLUTE算法评估,该算法建模肿瘤的拷贝数变化和突变情况。拷贝数负担评分包括n_segs和frac_altered,分别表示每个样本拷贝数谱中的总段数和偏离基线倍性比例。非整倍体评分通过计算扩增或缺失的染色体臂的累积和得出。TCR和BCR多样性评分,包括香农熵和丰富度,是从癌症RNA-seq数据中推断得出的。
基因组突变模式
使用maftools R包对来自TCGA的泛癌症标本进行按96个三核苷酸背景分类的突变非负矩阵分解(NMF)分析。随后将得到的突变谱与癌症体细胞突变目录(COSMIC)进行余弦相似性比较。
癌基因通路富集分析
从Sanchez-Vega等人的研究中获得了十个经典癌基因通路,包括187个癌基因。为了评估这些通路在每个样本中的活性,本研究在GSVA R包中使用ssGSEA方法。
解读拷贝数变异的影响
本研究采用先进的计算工具GISTIC 2.0,深入调查基因组区域中的显著缺失或扩增事件。该程序通过分析变化的幅度和频率,精准识别体细胞拷贝数变异。借助GISTIC 2.0的强大功能,本研究成功识别出可能在多种肿瘤类型的癌症发生与发展过程中发挥关键作用的重复性基因组变化。
功能富集分析
使用clusterProfiler R包进行识别的生物过程的功能富集分析和聚类。
CRISPR筛选数据
为了探索iMLGAM评分相关的潜在治疗靶点,本研究汇总了七项已发表的CRISPR/Cas9筛选研究的数据,这些研究分别评估了基因敲除对肿瘤免疫的个体影响,包括Freeman、Kearney、Manguso、Pan、Patel、Vredevoogd和Lawson的研究(表S6)。其中,前六项CRISPR研究的数据曾由Fu等人进行过整理。在此基础上,本研究进一步纳入了Lawson等人汇编的另一组CRISPR队列数据。
通过对这些研究数据的整合,本研究构建了17个数据集,涵盖了黑色素瘤、乳腺癌、结肠癌和肾癌等多种癌症类型,并根据不同细胞系和处理条件进行分类。本研究的核心目标是识别能够增强淋巴细胞介导的癌症杀伤能力并影响免疫治疗反应的关键基因。CRISPR筛选实验通过在癌细胞系中进行全基因组敲除,并利用RNA-seq技术测量sgRNA的丰度。sgRNA的对数折叠变化用于评估基因敲除在免疫压力下对癌细胞适应性的影响。通过标准化的z分数对这些变化进行量化,从而实现跨研究的比较。其中,较低的z分数表明更好的免疫反应。最终,基因根据其在多个数据集中的平均z分数进行排名,排名靠前的基因被归类为免疫耐受基因。
细胞培养
3LL和CT26细胞来源于中国典型培养物保藏中心(武汉,中国)。LLC细胞在DMEM中培养,而CT26细胞则在RPMI 1640培养基中维持。两种培养基均添加10%胎牛血清(FBS)、2 mM L-谷氨酰胺、1 mM丙酮酸、100 U/mL青霉素和100 µg/mL链霉素。
Western Blot
细胞在冰上裂解20分钟,使用含有1X RIPA、1X磷酸酶抑制剂和1X蛋白酶抑制剂(Thermo Fisher Scientific, Waltham, MA, USA)的缓冲液。裂解液在4°C下以1200× g离心5分钟,收集上清液。使用BCA蛋白测定试剂盒(Thermo Fisher Scientific)评估总蛋白浓度,每个孔加载40 µg蛋白进行SDS凝胶电泳。蛋白质在120 V下分离1小时,并以15 V转移到PVDF膜(Thermo Fisher Scientific)上30分钟。膜用Licor Revert Total Protein Stain染色以进行可视化。洗涤后用TBST洗涤并用5%牛血清白蛋白(BSA)封闭,主要抗体在4°C下孵育过夜。第二天,膜再次洗涤,并在室温下与二级抗体孵育1小时。膜成像使用Amersham™ ECL Select(Cytiva;Marlborough, MA, USA)进行。主要抗体的稀释比例为CEP55(Santa Cruz;Dallas, TX, USA)1:125和Beta-Actin(Cell Signaling Technology, Danvers, MA, USA)1:1500。
稳定转染细胞系构建
使用慢病毒转导在3LL和CT26细胞中生成稳定的CEP55敲低细胞系。首先,将HEK293T细胞转染慢病毒包装质粒(psPAX2和pMD2.G),以及CEP55靶向shRNA或shNC。48小时后,收集慢病毒上清液,并用聚赖氨酸(8 μg/mL)感染3LL和CT26细胞以提高感染效率。靶序列为:sh#1: CAGCATCAACTCTATGTGATT和sh#2: CGTTTAGAACTCGATGAATTT。经过24小时孵育后,培养基更换为新鲜DMEM,细胞恢复48小时。然后添加嘌呤霉素(2-10 μg/mL,针对每个细胞系优化)进行选择,维持5-7天以建立稳定转染细胞。通过qPCR和Western blot分析验证CEP55敲低效率。这些稳定细胞系随后用于功能实验,以评估CEP55在肿瘤免疫中的作用。
克隆形成
稀释单细胞悬液,每孔在6孔板中接种500个细胞。在37°C、5% CO2条件下培养10天。之后,用PBS洗涤,固定于4%多聚甲醛中30分钟,并用结晶紫染色20分钟。用自来水冲洗,然后拍照并计数形成的克隆。Transwell实验
为了评估细胞迁移,将肿瘤细胞稀释为单细胞悬液,并将2 × 105个细胞添加到Transwell的上室,底室中加入600 μL无血清培养基。在37°C、5% CO2条件下孵育36小时。孵育后,用棉签去除上室中未迁移的细胞,用4%多聚甲醛固定剩余细胞30分钟,并用0.1%结晶紫染色20分钟。用PBS洗涤三次,计数在显微镜下迁移到下室的细胞。对于侵袭实验,按照制造商的说明稀释Matrigel并涂覆上室,在37°C下孵育1小时以固化。重复上述程序:添加2 × 105肿瘤细胞,孵育36小时,去除未侵袭的细胞,固定、染色、洗涤并计数侵袭到下室的细胞。流式细胞术凋亡检测
收集细胞后,用预冷的PBS洗涤,将其重悬于Annexin V结合缓冲液中(每次实验约1 × 106个细胞)。向悬液中添加5 µL的Annexin V-FITC和5 µL的PI,在室温下避光孵育15分钟。使用流式细胞仪和FlowJo软件分析染色细胞的凋亡情况。
CD8+T细胞与肿瘤细胞的共培养
从野生型C57BL/6小鼠的脾脏中分离细胞,并通过70 µm过滤器过滤以制备单细胞悬液。在裂解红细胞后,使用免疫磁珠分选试剂盒(Cat # 480008, BioLegend)分离CD8+T淋巴细胞。计数T细胞并将其接种到涂有2.0 mg/mL抗-CD3(克隆145–2C11,BioLegend)和3 mg/mL抗-CD28(克隆37N,BioLegend)抗体的12孔板中,培养基为完全RPMI 1640,添加50 mM β-巯基乙醇和10 mM HEPES。经过48小时的激活后,将T细胞与来自敲低shNC或shCEP55的肿瘤细胞共培养。再经过48小时后,收集T细胞进行功能实验,并使用FlowJo软件进行分析。
建立小鼠皮下肿瘤模型
所有小鼠在天津医科大学癌症研究所和医院的动物设施中在特定病原体无菌(SPF)条件下饲养。将6-8周龄的雄性野生型C57BL/6小鼠放置在无菌环境中。肿瘤细胞在PBS中重悬,浓度为5 × 106个细胞/mL,每只小鼠皮下接种100 μL悬液(5 × 105个细胞)于右背侧。当肿瘤体积达到约100 mm³时,小鼠随机分组,通过腹腔注射小鼠程序性细胞死亡蛋白-1(PD-1)单克隆抗体(BioXcell, BE0146),每只小鼠剂量为100 mg,溶解于100 μL D-PBS缓冲液中。每2-3天用卡尺测量肿瘤大小,体积使用公式(体积 = 长度 × 宽度² / 2)计算。小鼠可自由进食和饮水,并保持在适宜的温度环境中。当达到预定的肿瘤大小或实验结束时,通过颈椎脱位安乐死小鼠,并收集肿瘤组织进行进一步分析。流式细胞术用于肿瘤-bearing小鼠
在肿瘤接种后,牺牲肿瘤-bearing小鼠,收集CT26或3LL肿瘤样本并切碎。样本在37°C下与消化液孵育1小时,并通过70 µm过滤器过滤以获得单细胞悬液。用裂解缓冲液在冰上裂解红细胞5分钟,然后洗涤并重悬于预冷的磷酸盐缓冲盐水(PBS)中。T细胞在37°C的CO2培养箱中用含10% FBS的完全RPMI 1640培养基、1.5 μg/mL单宁、100 ng/mL PMA和1 μg/mL离子霉素刺激4小时。洗涤细胞,使用CD16/32封闭,并在冰上避光染色20分钟。洗涤后,细胞在冰上与针对CD45(APC-CY7)、CD8(FITC)、CD3(PE-CY5.5)、PD-1(PB450)和TIM-3(BV605)的主要抗体染色25分钟。染色后,细胞用1%多聚甲醛固定20分钟,透化,并用颗粒酶B(GZMB,PerCP-CY5.5)、干扰素(IFN)-γ(APC)和肿瘤坏死因子(TNF)-α(PE/Cyanine7)进行细胞内染色。最后,使用Beckman DxFLEX流式细胞仪分析细胞,数据使用FlowJo软件处理。统计分析
使用Pearson或Spearman系数评估变量之间的相关性。对于正态分布的变量,使用t检验分析组间差异;否则,使用Mann-Whitney U检验。分类变量差异使用Pearson卡方检验或Fisher精确检验评估。K-M分析生成生存曲线,log-rank检验评估显著性。ROC分析确定最佳阈值,而多变量逻辑回归评估临床反应的独立风险因素。p值小于0.05被视为具有统计学意义。所有分析为双侧,并使用R软件(版本4.3.1)进行。
代码和数据可用性
本研究中使用的公共数据可在TCGA和GEO中获得。其他数据集则来自于文献中已发表的研究,如方法部分所述。该研究的分析过程、代码和数据嵌入在R包'iMLGAM'中,访问链接为:https://github.com/Yelab1994/iMLGAM。补充材料(图表、表格、图形摘要、幻灯片、视频、中文翻译版本和更新材料)可在在线DOI或iMeta Science网站找到:http://www.imeta.science/。引文格式:
Bicheng Ye, Jun Fan, Lei Xue, Yu Zhuang, Peng Luo, Aimin Jiang, et al. 2025. iMLGAM: integrated Machine Learning and Genetic Algorithm-driven Multiomics analysis for pan-cancer immunotherapy response prediction. iMeta4: e70011. https://doi.org/10.1002/imt2.70011.
作者简介
叶必成(第一作者)
● 东南大学医学院在读博士研究生。
● 研究方向为单细胞/空间转录组测序及机器学习,以第一作者在iMeta、Biofactors、Frontiers in Immunology等期刊发表SCI论文10篇。
范骏(第一作者)
● 江苏省人民医院(南京医科大学第一附属医院)胸外科主治医师。
● 研究方向为肺癌、食管癌的微创手术治疗及免疫治疗,以第一作者(含共同)在iMeta、Journal of Cellular and Molecular Medicine、Frontiers in Immunology等国际期刊发表多篇SCI论文,以第一发明人授权国家发明专利3件,担任江苏省整合医学会食管癌专委会委员。
薛磊(第一作者)
● 医学博士,江苏省人民医院胸外科副主任医师,2013年芝加哥Christ Hospital胸外科访问学者。
● 研究方向为食管肿瘤的微创手术治疗和靶向及免疫治疗,以第一作者(含共同)及通讯作者在iMeta、Journal of Cellular and Molecular Medicine等国际期刊及核心期刊发表论文10余篇,以第一发明人授权国家发明专利4件。担任江苏省整合医学会食管癌专委会常任委员、食管肿瘤整合康复专委会委员、江苏省抗癌协会肿瘤营养专业委员会委员。
庄宇(第一作者)
● 南京市胸科医院主治医师,南京医科大学外科学硕士。
● 研究方向为早期肺癌液体活检技术、多原发肺癌发生机制及食管恶性肿瘤转移机制,以第一作者(含共同)在iMeta、Biosensors and Bioelectronics、Molecular Therapy、Frontiers等期刊发表多篇SCI论文(最高IF 12.6),主持多项市级、校级科研课题。擅长肺部结节良恶性判读、精准肺段手术规划及达芬奇机器人微创手术,担任南京医科大学肺部结节诊疗中心团队成员、中国抗癌协会会员。
周文航(通讯作者)
● 淮安市第二人民医院肿瘤内科主治医师,徐州医科大学硕士。
● 研究方向为肺癌的临床和基础研究,获得淮安新技术引进奖一项(第一完成人)及多项省市级奖项,发表中文核心期刊及SCI论文多篇。
任传利 (通讯作者)
● 扬州大学附属苏北人民医院医学检验科主任,教授,主任技师,博士生导师,博士后合作导师,江苏省333人才第二层次培养对象。美国加州大学旧金山分校 (UCSF) 访问学者。
● 研究方向为肿瘤分子生物学研究,以通讯或第一作者(含共同)发表在Nature、NEJM、 Gastroenterology等期刊40余篇。获教育部高等学校优秀成果(科学技术)二等奖一项、江苏省科学技术三等奖一项。
林浩然(通讯作者)
● 江苏省人民医院胸外科主治医师,南京医科大学硕士。
● 研究方向为肺癌的临床和基础研究,以第一作者(含共同)在iMeta、Journal of Cellular and Molecular Medicine、Frontiers in Immunology等期刊发表多篇10余篇SCI论文。
张朋朋(通讯作者)
● 天津医科大学肿瘤医院肺癌外科博士。
● 研究方向为肿瘤微环境、肺癌、单细胞/空间转录组测序及机器学习,以第一作者/末位通讯作者在iMeta、Journal of ImmunoTherapy of Cancer、Cell Proliferation等期刊发表60余篇SCI论文。担任BMC Molecular and Cell Biology、Discover Oncology、BMC Medical Genomics、Frontiers in immunology等多个期刊编委,iMeta、Cell Proliferation、Med Research青年编委成员。担任iMeta、Research、Advanced Science、Cell Proliferation等50余种知名期刊审稿人。个人H指数18。
更多推荐
(▼ 点击跳转)
高引文章 ▸▸▸▸
iMeta | 引用16000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据
高引文章 ▸▸▸▸
iMeta | 兰大张东组:使用PhyloSuite进行分子系统发育及系统发育树的统计分析
高引文章▸▸▸▸
iMeta | 唐海宝/张兴坦-用于比较基因组学分析的多功能分析套件JCVI
iMeta封面
1卷1期
1卷2期
1卷3期
1卷4期
2卷1期
2卷2期
2卷3期
2卷4期
3卷1期
3卷2期
3卷3期
3卷4期
3卷5期
3卷6期
4卷1期
iMetaOmics封面
1卷1期
1卷2期
2卷1期
期刊简介
“iMeta” 是由威立、宏科学和本领域数千名华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等前沿交叉学科。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括中英双语图文、双语视频、可重复分析、图片打磨、60万用户的社交媒体宣传等。2022年2月正式创刊!相继被Google Scholar、PubMed、SCIE、ESI、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.8,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,学科研究类期刊全球第一,中国大陆11/514!
“iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!
来源:微生物组