大麦泛转录组揭示基因型依赖性转录复杂性的多层调控

360影视 2025-02-06 01:10 3

摘要:在生物学研究中,转录组学是连接基因组信息与生物功能的重要桥梁。传统的转录组研究通常依赖于单一参考基因组,这可能导致分析偏倚,无法全面反映物种内的遗传多样性。近年来,泛基因组的概念应运而生,它通过整合多个个体的基因组信息,更完整地展现物种的遗传变异。泛转录组则是

在生物学研究中,转录组学是连接基因组信息与生物功能的重要桥梁。传统的转录组研究通常依赖于单一参考基因组,这可能导致分析偏倚,无法全面反映物种内的遗传多样性。近年来,泛基因组的概念应运而生,它通过整合多个个体的基因组信息,更完整地展现物种的遗传变异。泛转录组则是泛基因组概念在转录组层面的延伸,旨在描述物种内多个个体基因组多样性所导致的转录和转录后调控的差异。通过整合多个基因组和转录组信息,泛转录组学能够更全面地解析基因表达调控网络,揭示基因型与表型之间的复杂关系。

大麦(Hordeum vulgareL.)是全球重要的粮食作物和饲料来源,具有广泛的适应性和遗传多样性。深入理解大麦的转录调控机制,对于解析其环境适应性和改良农艺性状具有重要意义。构建和分析大麦的泛转录组,有助于克服传统转录组研究的局限性,揭示基因型差异对转录调控的影响,为大麦遗传改良和精准育种提供理论基础。例如,鉴定与抗逆性相关的基因及其调控元件,有助于培育适应气候变化的抗逆大麦品种。

近日,由多个国际研究团队组成的小组在Nature Genetics发表了题为“A barley pan-transcriptome reveals layers of genotype-dependent transcriptional complexity”的论文,揭示了大麦基因型依赖性转录复杂性的多层调控机制。该研究构建了一个包含20个代表性大麦品种的泛转录组,并结合多种生物信息学分析方法,揭示了基因组变异、RNA可变剪切、拷贝数变异等因素对转录调控的影响,为大麦遗传改良和精准育种提供了新的见解。

大麦泛转录组的构建

研究团队构建了一个包含20个大麦自交系基因型的泛转录组。这些基因型代表了驯化大麦的多样性,覆盖了广泛的遗传背景。研究人员对来自多个组织的短读(Illumina)和长读(PacBio Iso-Seq)RNA测序数据集进行了生成和分析,以克服转录本定量中的单一参考偏倚。他们构建了基因型特异性参考转录数据集(GSRTDs),并将这些数据集整合到一个线性泛基因组框架中,创建了泛RTD (PanBaRT20),从而将转录本分类为核心(在20个大麦中都存在)、可变(2-19个材料中存在)或特异(仅在一个材料中存在)(图1)。核心转录本在所有基因型中均有表达,而可变和特异转录本则表现出基因型特异性表达。

转录多样性和分类

研究人员发现,“组织”是转录多样性的主要驱动因素(图1b)。多维尺度分析(MDS)显示,不同组织样本在转录组水平上呈现明显的聚类,表明组织特异性表达模式是大麦转录组变异的主要来源。为了避免使用单一参考基因组在mapping RNA-seq reads时引入基因型偏倚,研究人员为20个个体中的每一个都生成了基因型特异性参考转录数据集(GsRTD)。与单一参考基因组相比,GsRTD可以组装更广泛的转录本,从而产生更全面的mapping结果。在PanBaRT20中,核心基因(在所有基因型中都表达)与普遍存在的生物学功能相关,例如DNA复制、转录和核糖体功能,而对生物和非生物胁迫的反应则在可变和特异基因类别中占主导地位,表明这些基因的表达调控可能受到环境因素的影响。

图1GsRTDs和PanBaRT20作为转录组分析的参考

开发泛基因组的一个关键论点是,与单一共同参考基因组相比,它可以减少基因组分析中的偏差。因此,研究人员调查了不同的参考转录组如何偏倚RNA-seq数据集中的定量精度。对PanBaRT20的基因型特异性转录组数据分析显示,平均mapping率为87.3%,比BaRTv2.0高11.1%,但仅比GsRTDs的平均mapping率高3.3% (图1d)。为了进一步探索,研究人员模拟了来自五个不同基因型的RNA-seq reads,并使用PanBaRT20、单独的GsRTD和GsRTD Morex(作为常见参考基因组的代表)分析了它们。研究发现,各个GsRTD实现了最高的定量精度,PanBaRT20和GsRTDs的性能均优于GsRTD Morex。因此,GsRTD(如果可用)最适合RNA-seq read定量,但泛RTD通常比单一常见参考基因组更合适,尤其是在研究涉及多个基因型时。

转录本丰度变异的驱动因素

PanBaRT20揭示了每个基因的转录本数量比GsRTD显著增加(从3.5到7.3)。这反映在非冗余剪接连接(SJ)的数量增加上,GsRTD的平均数量为146,600,而PanBaRT20为311,300。例如,在核心单拷贝基因的高表达转录本中,132个保留了内含子,112个具有可选择的3'剪接位点,66个具有可选择的5'剪接位点,17个具有跳过的外显子,17个具有可选择的第一个外显子事件,这些变异在泛转录组中生成了独特的基因型特异性转录本。这些可变剪接事件可能导致蛋白质功能多样性,从而影响大麦的表型变异。

图2基因存在/缺失变异(PAV)和拷贝数变异(CNV)的影响

研究人员接下来探索了存在/缺失变异(PAV)和拷贝数变异(CNV)对转录本丰度的影响。在20个GsRTD中,2,925个基因在1-19个基因型的所有组织中均表现出零TPM。在这些病例中的2,899个中,它们各自的基因在泛基因组组装中不存在,因此可以归类为PAV。它们富含与“调节”和“反应”相关的GO术语,研究人员将其解释为可能与“条件可有可无”相关,意味着这些基因可能在特定环境条件下才发挥作用。然后,研究人员使用PanBaRT20上的聚类分析来探索整个泛基因组的CNV程度。研究人员鉴定了723个串联基因簇,其中98个显示拷贝数与一个或多个组织中的转录本丰度之间存在显著的正相关。例如,编码冷诱导CBF转录因子的基因簇的CNV与抗寒性相关,表明CNV可能影响大麦的抗逆性。

7H染色体倒位的影响

最初的大麦泛基因组揭示了单个基因型(cv. RGT Planet)中7H染色体上的141 Mb倒位。为了评估这种倒位的潜在功能影响,研究人员研究了一个包含201个当代春大麦品种四个组织的RNA-seq数据的基因表达数量性状基因座(eQTL)数据集,包括cv. RGT Planet。eQTL分析清楚地识别了31个含有倒位的基因型和170个不含倒位的基因型。在倒位区域内,研究人员观察到36个显著上调基因和39个显著下调基因。有趣的是,所有上调基因都位于倒位的端粒末端附近,所有下调基因都位于朝向着丝粒的方向。该区域以前与籽粒大小相关性状、淀粉含量、蛋白质含量和α-淀粉酶活性有关,提示该倒位可能通过影响这些基因的表达调控,进而影响大麦的籽粒品质。

转录因子结合位点(TFBS)的变异分析

鉴于可以访问互补的泛基因组,研究人员接下来评估了直系同源基因近端区域中转录因子结合位点(TFBS)的变异是否会影响转录变异。研究人员计算了CDS上游2,000 bp和下游500 bp中30个TFBS的位置和出现频率,并将它们与代表cv. Morex所有基因的参考集进行比较。结果表明,TFBS的变异与基因表达水平之间存在一定的相关性,但这种相关性在不同基因类别中有所差异,表明TFBS变异对基因表达调控的影响可能受到其他因素的调控。

基因表达和基因网络比较分析

为了研究单拷贝核心基因中的表达变异,研究人员对所有20个基因型进行了比较共表达分析。通过应用加权相关网络分析(WGCNA),研究人员构建了20个基因型特异性共表达网络,总共产生了738个模块。这些模块可以聚类成六个主要的群落,每个群落都与特定的组织和生物学过程相关,表明基因共表达模式在不同基因型中存在差异。

图3参考基因组Morex的基因表达图谱

鉴于PanBaRT20中已定义的组织,研究人员探索了来自单一参考基因组Morex的更广泛组织和处理反应中的转录本丰度变异。研究人员利用了所有公开可用的(截至2023年9月)复制Morex RNA-seq数据集,这些数据集来自大麦发育的各个阶段以及对不同刺激的反应。他们构建了一个新的Morex参考转录组(Mx-RTD),并用它来量化所有315个Morex样本中的基因和转录本丰度。结果显示,组织是转录变异的主要驱动因素,处理对基因表达的影响相对较小。

图4探索赤霉素2-氧化酶基因家族

为了说明PanBaRT20和MorexGeneAtlas的价值,研究人员探索了赤霉素2-氧化酶(GA2ox)基因家族成员的空间、时间和基因型特异性表达。赤霉素(GA)代谢在打破籽粒休眠和启动萌发以及植物细胞伸长从而促进营养生长和籽粒产量方面具有核心重要性。研究发现,不同GA2ox基因在不同组织和基因型中表现出不同的表达模式,表明它们在GA代谢调控中可能发挥着不同的作用。

图5

这项研究通过构建大麦泛转录组,揭示了基因型依赖性转录复杂性的多层调控机制。研究结果表明,基因组变异、RNA加工、拷贝数变异等因素共同驱动了转录本丰度的变化,并影响大麦的适应性和农艺性状。未来的研究可以进一步探索这些调控机制的分子基础,例如,鉴定调控可变剪接的关键RNA结合蛋白,以及阐明CNV影响基因表达的顺式和反式调控机制。同时,可以将研究结果应用于大麦的遗传改良和育种,例如,利用基因编辑技术创制具有特定基因型和表达模式的大麦新品种,以提高产量和品质。该研究为理解大麦的基因型与表型之间的关系提供了重要线索,有助于培育更适应环境变化、产量更高、品质更优的大麦新品种。

本文第一作者为Wenbin Guo, Miriam Schreiber, Vanda B. Marosi, Paolo Bagnaresi, Morten Egevang Jørgensen。通讯作者为Micha Bayer, Craig Simpson, Runxuan Zhang和Robbie Waugh。研究团队来自苏格兰James Hutton研究所 (IBH/JHI)、德国Helmholtz慕尼黑中心 (PGSB) 等机构,并获得了苏格兰政府乡村和环境科学战略研究计划(RESAS)、生物技术和生物科学研究委员会(BBSRC)、欧盟地平线2020计划等多项基金资助。

DOI链接:https://doi.org/10.1038/s41588-024-02069-y

声明:以上内容为AI辅助翻译+人工校正,难免错漏,建议后续继续参考原文。

来源:图拉

相关推荐