Mol Cell | 王金凯团队开发基于内源性标记的纳米孔测序单分子m6A检测算法揭示m6A在RNA异构体上的复杂性

360影视 2025-02-08 10:40 2

摘要:真核生物的pre-mRNA能够通过选择性加工形成不同的RNA异构体,这些可变的加工方式包括可变剪接、可变加尾,此外,相同基因也存在可变启动子,从而产生具有不同5’端的RNA异构体。这些种类复杂的RNA异构体在哺乳动物细胞中广泛存在,然而m6A是否能够选择性地标

真核生物的pre-mRNA能够通过选择性加工形成不同的RNA异构体,这些可变的加工方式包括可变剪接、可变加尾,此外,相同基因也存在可变启动子,从而产生具有不同5’端的RNA异构体。这些种类复杂的RNA异构体在哺乳动物细胞中广泛存在,然而m6A是否能够选择性地标记这些RNA异构体并不清楚,尤其是不同RNA异构体上的相同m6A位点是否也能够产生差异的m6A修饰?对这一科学问题理解的欠缺主要是由于技术的匮乏。由于现有的m6A检测技术需要对RNA进行打断,而第二代高通量测序只能读取短序列,因此难以区分不同异构体上的m6A,而第三代测序技术牛津纳米孔测序(ONT)可以通过直接RNA测序(DRS)直接读取全长RNA穿过纳米孔的电流变化来检测m6A修饰,由于纳米孔一次性读取多个碱基的电信号,利用电信号检测m6A需要依赖深度学习模型。由于缺乏大规模的单分子水平的m6A阳性信号, 目前的深度学习模型虽然能够准确识别m6A位点,但是难以达到单分子水平的分辨率,依然无法准确地分辨不同异构体上的m6A修饰状态。

2025年2月7日,中山大学中山医学院王金凯课题组在Molecular Cell杂志上在线发表了题为“Single-molecule m6A detection empowered by endogenous labeling unveils complexities across RNA isoforms”的研究论文,通过在第三代牛津纳米孔直接RNA测序的单个长读长上准确检测m6A修饰,揭示了相同的m6A位点在不同的异构体上也能够通过至少三种不同的机制产生广泛的差异,为理解m6A在异构体上的复杂性提供了新的视角。

在该工作中,研究者发现,在DART-seq中,APOBEC1-YTH融合蛋白诱导的C-to-U突变并非集中于m6A邻近位置,而倾向于在距离m6A位点100 nt范围内聚集成簇。这些突变能够用于标记m6A位点,而不会干扰纳米孔直接RNA测序(ONT DRS)中m6A甲基化5-mer的电流信号。基于这种内源性标记策略,作者在ONT DRS数据中提取了1020237个读长水平的5-mer m6A信号,并结合深度残差神经网络,成功开发了能够在单条读长水平上识别m6A的工具m6Aiso。与多种已知的实验方法和计算工具相比,m6Aiso不仅能够高精度地检测和量化m6A位点,还能有效识别以往算法容易忽略的低甲基化m6A位点,展现了高度的灵敏性和准确性。

通过m6Aiso,作者阐明了三种能够在相同m6A位点不同的异构体上形成差异化m6A修饰的机制:(1) 相同的m6A位点在不同的异构体上离外显子边界的距离不同,受到EJC(外显子接头复合物)抑制的程度不同;(2)RNA结合蛋白,如TARBP2,在不同异构体上选择性结合;(3)由于转录因子可以通过共转录的方式招募m6A 的甲基化转移酶来修饰其转录的RNA,因此使用不同启动子的RNA由于转录因子不同而产生差异的m6A修饰。

上述第三种机制的阐明是来自于作者利用m6Aiso对TGF-β诱导的上皮间质转化模型的研究,研究人员发现TGF-β诱导后,活化的转录因子SMAD3会通过招募METTL3/METTL14/WTAP选择性地促进以SMAD3为启动子的下游RNA的m6A修饰, 从而造成相同基因使用不同启动子的异构体呈现选择性的m6A上调,而上调的m6A主要位于这些异构体共享的和3’UTR区以及终止密码子附近。因此,这种选择性启动子介导的异构体特异性m6A调控无法通过短序列二代测序来检测,只有通过具有单分子分辨率的长读长测序技术才能发现。

论文通讯作者是中山大学中山医学院王金凯教授,其课题组博士后郭文冰、任志军和黄翔为论文的共同第一作者。

https://www.cell.com/molecular-cell/abstract/S1097-2765(25)00049-8

BioART战略合作伙伴

来源:博儿爱科学

相关推荐