摘要:真核生物pre-mRNA剪接是一个受到精密调控的复杂生物学过程。经典剪接信号(如剪接供体位点的GU二核苷酸、受体位点的AG二核苷酸,以及分支点序列)作为核心调控元件已被广泛研究,然而基因组中大量非经典调控元件对剪接过程的调节机制仍不清楚。肌萎缩侧索硬化症(Am
BioArtMED
2025年02月03日 14:30印度尼西亚
真核生物pre-mRNA剪接是一个受到精密调控的复杂生物学过程。经典剪接信号(如剪接供体位点的GU二核苷酸、受体位点的AG二核苷酸,以及分支点序列)作为核心调控元件已被广泛研究,然而基因组中大量非经典调控元件对剪接过程的调节机制仍不清楚。肌萎缩侧索硬化症(Amyotrophic lateral sclerosis, ALS)是一种严重的运动神经元疾病。目前大部分散发性ALS患者的遗传学基础还不完全清楚。RNA异常剪切是ALS的关键分子机制。许多RNA结合蛋白 (RNA binding proteins, RBPs) 由ALS相关基因编码,包括TARDBP、FUS、ATXN2、HINRNPA1、HINRNPA2B1 和MATR3 【1】。值得注意的是,约97%的ALS患者组织中具有TDP-43蛋白的异常聚集,这一现象为ALS的核心病理标志。近几年一系列研究(Harvard大学Kevin Eggan团队,Stanford大学Aaron Gitler团队和UCL Pietro Fratta团队)表明,TDP-43的细胞核内功能丧失(loss of function, LOF)会导致广泛的RNA剪接异常【2-4】,提示RNA加工异常是ALS的重要致病机制。然而,对驱动RNA异常剪切的内含子变异在ALS 中的作用仍然知之甚少。
近日,同济大学医学院张明团队,联合华山医院陈嬿团队和中科院生物与化学交叉研究中心陈椰林团队等在Brain杂志发表了题为Deep learning analyses of splicing variants identify the link of PCP4 with amyotrophic lateral sclerosis 的研究论文。该工作开发了一种基于Transformer的新型深度学习方法(Spliformer, https://github.com/TJ-zhanglab/Spliformer),可准确预测pre-mRNA剪接,并鉴定剪接调控元件(motif)。Spliformer比其他深度学习剪接预测工具(SpliceAI, Pangolin)具有更好的预测性能。在大规模ALS人群全基因组测序数据中, Spliformer鉴定了已知ALS基因中的罕见剪接变异(如PTPRN2, CFAP410),以及TDP-43 LOF相关的RNA异常剪接基因中的剪接变异(如PTPRD)。遗传学分析和minigene实验提示了PCP4和TMEM63A携带的罕见内含子剪接变异与ALS疾病风险有关。进一步功能实验发现PCP4对于维持神经元树突棘密度至关重要,而过表达PCP4可以挽救ALS致病的TDP-43突变导致的神经元树突棘损失。该工作开发了Spliformer深度学习工具可准确预测和解读pre-mRNA剪接,鉴定了内含子变异也是导致ALS患者中异常RNA剪接的重要机制,并提示了PCP4是一个ALS相关基因。
研究人员首先开发了一个基于卷积神经网络和Transformer网络架构的深度学习工具Spliformer,用于预测RNA剪接,并在整合数据集(GENCODE、不同人体组织的RNA-seq)上验证了Spliformer相较于已有的剪接预测工具 (SpliceAI、Pangolin及MaxEntScan) 具有更好的性能 (图1)。此外,在配对的全基因组和转录组数据中,Spliformer也比SpliceAI具有较好的预测性能(PRAUC 0.5 vs 0.46)。
图 1 Spliformer的模型架构及评估
接着,研究人员对ALS患者全基因组测序数据中的罕见内含子变异进行分析,鉴定出与已知 ALS 基因相关的罕见剪接变异以及与TDP-43 LOF相关的RNA错误剪接基因相关的剪接变异。在中国(n=307)及加拿大(n=223)ALS队列中,共发现28个剪接变异位于已知ALS基因上(如PTPRN2、UNC13A和OPTN),30个剪接变异位于已报道的TDP-43 LOF相关的异常剪接基因上(如UNC13A和PTPRD) 。此外,在TargetALS (n=164) 和AnswerALS(n=676)全基因测序数据集中,发现19个剪接变异位于已知ALS基因上(如PTPRN2),14个剪接变异位于已报道的TDP-43 LOF相关的异常剪接基因上(如PTPRD)。
为了探究其他可能与ALS风险相关的剪接变异, 研究人员运用Spliformer工具分析了中国和加拿大ALS队列(n=530)中重合的罕见内含子剪接变异,且这些变异有至少三名携带者,其中位于PCP4与TMEM63A的变异得到minigene实验验证 ,并且这两个基因具有人脑组织空间和细胞类型表达特异性。通过遗传学分析,研究人员进一步发现 PCP4 rs540733543 A-等位基因与 ALS 风险显著关联 (n=1,370 ALS,n=34,543 Controls, 东亚和非芬兰欧洲祖先,p=0.0008)。而TMEM63A rs755440077 A-等位基因与 ALS 风险显著关联 (n=1,370 ALS, n=34,549, p=0.0017)。
研究人员通过基于人脑运动皮层/前额叶皮层单细胞核测序和空间转录组学数据分析,进一步发现PCP4是L5皮层marker基因,也是L5兴奋性神经元的marker,其基因表达在散发性ALS患者的兴奋性神经元中显著下调。该研究团队的前期研究5提示了人脑L5皮层是ALS的易感区域,因此研究人员针对PCP4开展了进一步的功能实验, 在大鼠海马切片中发现PCP4对于维持树突棘密度至关重要。此外,PCP4过表达可挽救ALS致病的TDP-43 A90V突变造成的神经元树突棘损失。
该研究由同济大学医学院、复旦大学附属华山医院、中国科学院上海有机化学研究所生物与化学交叉研究中心和多伦多大学等多家机构合作完成。同济大学医学院张明研究员为该论文的唯一通讯作者。同济大学医学院博士生唐雪琳、华山医院神经内科陈嬿副主任医师与中国科学院上海有机化学研究所生物与化学交叉研究中心任永飞博士为该论文的共同第一作者。该工作得到北京大学第三医院樊东升教授团队和斯坦福大学Aaron Gitler教授团队的指导和帮助。
同济大学张明团队聚焦理解基因组功能多样性的基础,开发深度学习算法,整合多组学策略,解析ALS等神经退行性疾病的分子/细胞/空间机制,鉴定生物标志物。课题组招募助理教授、博士后和硕士/博士研究生,待遇从优。
制版人:十一
参考文献
1. Scotti MM, Swanson MS. RNA mis-splicing in disease. Nat Rev Genet. Jan 2016;17(1):19-32. doi:10.1038/nrg.2015.3
2. Klim JR, Williams LA, Limone F, et al. ALS-implicated protein TDP-43 sustains levels of STMN2, a mediator of motor neuron growth and repair.Nat Neurosci. Feb 2019;22(2):167-179. doi:10.1038/s41593-018-0300-4
3. Brown A-L, Wilkins OG, Keuss MJ, et al. TDP-43 loss and ALS-risk SNPs drive mis-splicing and depletion of UNC13A. Nature. 2022/03/01 2022;603(7899):131-137. doi:10.1038/s41586-022-04436-3
4. Ma XR, Prudencio M, Koike Y, et al. TDP-43 represses cryptic exon inclusion in the FTD-ALS gene UNC13A. Nature. Mar 2022;603(7899):124-130. doi:10.1038/s41586-022-04424-7
5. Guo J, You L, Zhou Y, et al. Spatial enrichment and genomic analyses reveal the link of NOMO1 with amyotrophic lateral sclerosis. Brain. Aug 1 2024;147(8):2826-2841. doi:10.1093/brain/awae123
来源:营养和医学