六倍体垂穗披碱草基因组分析揭示小麦族Y染色体组起源及高海拔适应机制

360影视 日韩动漫 2025-04-07 17:12 1

摘要:小麦族(Triticeae)包含了小麦、大麦、黑麦等重要粮食作物以及众多具有重要生态和育种价值的牧草和野生物种。该族植物普遍经历了复杂的多倍化和杂交事件,形成了多样的基因组构成。披碱草属(Elymus)是小麦族最大的属,几乎全部由异源多倍体构成,其基因组通常包

小麦族(Triticeae)包含了小麦、大麦、黑麦等重要粮食作物以及众多具有重要生态和育种价值的牧草和野生物种。该族植物普遍经历了复杂的多倍化和杂交事件,形成了多样的基因组构成。披碱草属(Elymus)是小麦族最大的属,几乎全部由异源多倍体构成,其基因组通常包含来自不同二倍体祖先的染色体组(单倍型),如St(来自假鹅观草属Pseudoroegneria)、H(来自大麦属Hordeum)、Y(未知来源)等。其中,Y染色体组广泛存在于亚洲的披碱草属物种中,但其二倍体祖先至今未被发现,其系统发育起源一直存在争议,传统观点认为其与St染色体组亲缘关系最近,但这与部分分子证据相悖。垂穗披碱草(Elymus nutans)是一种广泛分布于青藏高原(QTP)及其周边地区的异源六倍体(2n = 6x = 42, StStYYHH)牧草,具有优良的抗逆性(耐寒、耐旱、耐贫瘠、耐紫外辐射),是高寒草地生态恢复和牧草遗传改良的重要种质资源。然而,缺乏高质量的参考基因组限制了对其遗传机制、环境适应性及育种应用的深入研究。解析垂穗披碱草基因组,不仅有助于揭示Y染色体组的神秘起源和小麦族物种的复杂进化历史,还能为发掘高海拔适应性状的关键基因、推动牧草和作物遗传改良提供重要依据。

四川农业大学草学院、兰州大学生态学院、西南科技大学生命科学与工程学院等单位的Xiao MaYongzhi YangShiqie BaiJianquan Liu团队在Nature Communications发表题为“Analysis of allohexaploid wheatgrass genome reveals its Y haplome origin in Triticeae and high-altitude adaptation”的论文,报道了高质量的六倍体垂穗披碱草染色体级别基因组,通过系统发育基因组学分析揭示了小麦族中神秘的Y染色体组起源于一个与簇毛麦属(Dasypyrum)和偃麦草属(Thinopyum)近缘的祖先类群,而非之前认为的与St染色体组关系密切;同时,结合群体基因组学和关联分析,阐明了该物种适应青藏高原极端环境(特别是强紫外辐射)的关键遗传机制,为理解异源多倍体进化和作物遗传改良提供了新见解。

异源六倍体垂穗披碱草基因组组装与注释

研究团队对采自青藏高原海拔5012米的垂穗披碱草野生种质FS20130进行了基因组测序和组装。利用PacBio HiFi和Hi-C技术,成功构建了一个高质量的染色体级别参考基因组。该基因组大小为10.47 Gb,contig N50达到76.25 Mb,远超已报道的近缘物种西伯利亚披碱草(E. sibiricus)。其中,95.05%的序列被成功挂载到21条假染色体上。基因组完整性评估显示BUSCO达到99.50%,LAI值为13.97,表明组装质量高、连续性好。基因组中重复序列含量高,占83.02%(8.67 Gb),其中长末端重复序列(LTR)反转座子是主要类型(占基因组62.56%),这与其他禾本科作物(如玉米、大麦、小麦)相似。共预测到120,538个蛋白质编码基因,其中91.58%得到了功能注释(图1a,补充表1-4,补充图2-4)。

通过k-mer分析和共线性分析,研究人员将21条染色体明确划分为三个亚基因组,分别对应St、Y和H染色体组(每个亚基因组7条染色体)。系统命名为En-St01至En-St07, En-Y01至En-Y07, En-H01至En-H07。比较基因组学分析显示,垂穗披碱草的St亚基因组(En-St)与西伯利亚披碱草的St亚基因组以及大麦的H染色体组(Hv-H)保持了高度的共线性,几乎没有大的结构变异,这可能代表了较为古老的染色体结构状态。相比之下,En-H和En-Y亚基因组则经历了更多的染色体重排。值得注意的是,研究发现了一个在H和Y亚基因组间发生的非罗伯逊易位(non-RTA)事件:H04染色体长臂末端与Y03染色体短臂末端发生了大片段相互交换。这导致En-H04保留了H04的主要部分和着丝粒,并整合了Y03的一小段序列,而En-Y03则保留了Y03的主要部分和着丝粒以及剩余片段。该非RTA事件得到了亚基因组特异性k-mers、共线性分析、Hi-C互作热图和非变性荧光原位杂交(ND-FISH)实验的共同验证(图1b-e,补充图5-7)。此外,在Y亚基因组内部也检测到发生在Y04和Y05末端的小片段易位。同义替换率(Ks)分析表明,St和Y亚基因组的分化时间晚于它们各自与H亚基因组的分化时间,暗示St与Y的遗传关系相对更近(补充图6)。

图1同源基因表达与功能分化

为探究多倍化后基因表达的演变,研究分析了三个亚基因组(St, Y, H)间同源基因的表达模式。共鉴定到15,875个在三个亚基因组中呈1:1:1对应关系的三联体同源基因(triads),以及大量的二联体同源基因(diplets)。对缺失基因的分析表明,假基因化是同源基因丢失的主要机制。在干旱、低温和UV-B胁迫条件下对三联体基因的表达偏好性进行分析,结果显示,大多数三联体基因(54.34%-62.69%)呈现平衡表达模式,即三个同源拷贝的表达量大致相等。单一亚基因组的表达占优势(dominance)的模式相对较少(2.84%-6.47%)。不同胁迫处理间以及与对照相比,七种同源基因表达模式的分布频率没有显著差异。同样,在不同胁迫下,各亚基因组中上调或下调的差异表达基因(DEG)数量也无显著差异,GO功能富集分析也显示它们的功能相似。这表明,在整体水平上,垂穗披碱草的三个亚基因组并未形成明显的表达优势或功能分化。然而,共表达网络分析发现,来自Y亚基因组的基因更倾向于出现在表达模式存在分歧的模块中,暗示Y亚基因组可能在特定条件下或特定性状上扮演了更活跃或差异化的角色。Ka/Ks分析显示,整体上三个亚基因组间的选择压力相似,但在Ka/Ks > 1的基因对中,观察到了亚基因组间的功能差异,提示存在新功能化(neo-functionalization)的可能。对经典胁迫响应基因三联体的分析也发现了亚功能化(sub-functionalization)和新功能化的证据。有趣的是,大部分胁迫响应的DEG并不属于1:1:1三联体基因,它们位于不同的基因组区域。这些结果表明,垂穗披碱草基因组在多倍化后整体保持了相对保守的表达模式,但也存在部分基因通过亚功能化和新功能化途径发生适应性进化,这对于物种适应多样的环境胁迫至关重要(补充图8-18,补充数据1-12)。

Y染色体组的系统发育起源

Y染色体组的起源是小麦族系统发育研究中的一个长期悬而未决的问题。该研究利用包括垂穗披碱草在内的12个小麦族代表物种(共20个染色体组/亚基因组)构建了系统发育树。结果清晰地显示,小麦族主要的二倍体祖先染色体组是按照Ns (来自Leymus) -> Xm (来自Leymus) -> H (Hordeum) -> St (Pseudoroegneria) 的顺序依次分化出来的。这些主要谱系的分化时间分别约为13.92, 11.68, 10.22和9.04百万年前(Mya)。最关键的发现是,垂穗披碱草中的Y染色体组(En-Y)与来自簇毛麦属(Dasypyrum)的V染色体组和来自中间偃麦草(Thinopyrum intermedium)的Jv染色体组聚在同一分支,形成姐妹群关系,它们共同的祖先大约在6.29 Mya与其他小麦族谱系分化开来。这一结果明确否定了长期以来认为Y与St染色体组具有最近共同祖先的假说,表明Y染色体组的二倍体供体祖先(尽管尚未找到)在系统发育上更接近DasypyrumThinopyrum属。H、St和Y这三个构成亚洲披碱草属主要基因组成分的祖先谱系,它们之间的分化发生在10.22至8.02 Mya之间(图2a)。

图2披碱草属网状进化历史

为了更深入地理解包含St、Y、H染色体组的披碱草属物种的复杂形成过程,研究团队对来自Pseudoroegneria(St),Hordeum(H),Roegneria(StY),Elymus(StH, StYH) 等属的28个代表性物种进行了重测序。将测序数据比对到垂穗披碱草参考基因组上,确认了这些物种的基因组组成,并纠正了以往对个别物种(如阿拉善鹅观草E. alashanica)基因组组成的疑问(确认为StY)。比对结果显示,一种名为Hordeum roshevitzii的野生大麦与垂穗披碱草的H亚基因组同源性最高(74.74%),而一种名为Elymus burchan-buddae(异名Roegneria nutans,StY基因组)的四倍体披碱草则与垂穗披碱草的St亚基因组(90.01%)和Y亚基因组(85.76%)同源性最高。基于这些物种的2046个单拷贝直系同源基因构建的系统发育树再次清晰地将St、Y、H三个谱系分开,并且在每个谱系内部,不同倍性的物种(二倍体、四倍体、六倍体)的聚集关系也反映了它们之间复杂的网状进化联系(图2b, 图3b)。

叶绿体基因组(母系遗传)的系统发育分析进一步揭示了网状进化的复杂性。具有相同核基因组组成的物种,有时却拥有来自不同母本祖先的叶绿体基因组,例如E. dahuricusE. excelsus。所有StYH六倍体物种(如垂穗披碱草)的叶绿体基因组都与StY四倍体物种(如E. burchan-buddae)更为接近,而不是与二倍体的St或H供体接近。这有力地支持了StY四倍体是StYH六倍体的直接母本供体,而二倍体的H供体则作为父本参与杂交。结合叶绿体系统发育、核基因系统发育以及形态学特征(如E. burchan-buddaeE. nutans都具有下垂的穗状花序和重叠的分布区),研究推断:垂穗披碱草(StStYYHH)很可能是由一个类似E. burchan-buddae的StStYY四倍体作为母本,与一个类似H. roshevitzii的HH二倍体作为父本,通过远缘杂交和多倍化形成的,这一事件大约发生在1.5 Mya。基于以上所有证据,研究提出了一个包含St、Y、H染色体组的披碱草属物种形成的网状进化模型(图3c):首先,二倍体St祖先分别与二倍体H祖先和二倍体Y祖先杂交多倍化,形成四倍体的StH (Elymus s.s.) 和 StY (Roegneria);然后,这些四倍体物种作为“桥梁”,通过与二倍体或四倍体物种进一步杂交和多倍化,形成了StHH, StStH, StStY, StYY, StYH等多种基因组构成的六倍体物种。

图3垂穗披碱草群体遗传结构与起源扩散

研究收集并重测序了197份覆盖垂穗披碱草主要分布区(青藏高原及中亚)的野生种质(平均测序深度12x),鉴定到约4364万个高质量SNP。连锁不平衡(LD)分析显示其衰减速度较快。群体遗传结构分析(NJ树、PCA、ADMIXTURE)将这些种质划分为三个主要的遗传簇(Cluster I, II, III),这三个簇与海拔分布显著相关:低海拔簇(I,主要分布于青藏高原东部)、高海拔簇(II,主要分布于青藏高原西部和中亚)和中海拔簇(III,主要分布于横断山区)。检测到显著的距离隔离(IBD)和环境隔离(IBE)模式。利用多种方法(PSMC, GADMA, DIYABC-RF)进行种群历史动态模拟,结果一致表明:位于横断山区的中海拔簇(Cluster III)是最早分化形成的群体;随后,高海拔和低海拔簇(Cluster II 和 I)从中分化出来并向外扩散。不同群体间存在较强的基因流。核苷酸多样性(π)分析显示,中海拔簇(横断山区)的遗传多样性最高。综合来看,横断山区可能是垂穗披碱草的主要起源中心和末次冰期的避难所,物种从这里向高海拔和低海拔地区扩展(图4,补充图20-27,补充数据14)。

图4垂穗披碱草高海拔适应的遗传基础

为揭示垂穗披碱草适应高海拔极端环境(特别是强紫外辐射和低温)的遗传机制,研究采用了基因型-环境关联分析(GEA)和全基因组关联分析(GWAS)。GEA分析鉴定了2950个与9个关键环境因子(包括年均温、年降水量、UV-B辐射强度等)显著关联的SNP,涉及340个基因。其中541个SNP(涉及1281个基因)在冗余分析(RDA)中表现出显著的负载,被认为是“关键适应性SNP”。

温度适应:位于一个NAC转录因子基因(Enu.ptg000038l.G2830)启动子区的SNP与年均温(bio1)显著关联。携带A等位基因的个体主要分布在年均温较低的青藏高原西部,而G等位基因在较温暖地区近乎固定。qRT-PCR实验表明,A等位基因在低温胁迫下表达量显著高于G等位基因,暗示该基因型有助于耐寒(图5a-d)。

干旱适应:位于一个柠檬酸合酶基因CISY4Enu.ptg0000071.G716)3'-UTR区的SNP与年降水量(bio12)显著关联。携带C等位基因的个体多分布于年降水量较低的区域,T等位基因则在湿润地区频率更高。qRT-PCR显示,T等位基因在干旱胁迫下表达量显著升高,提示其可能增强了植株的抗旱能力(图5e-h)。

UV-B适应:一个丝裂原活化蛋白激酶激酶激酶基因MAPKKK18Enu.ptg000014l.G363)被发现与6个UV-B辐射相关的环境因子均显著关联,并表现出强烈的选择信号。该基因启动子区域存在3个紧密连锁的SNP,可以将所有种质划分为3种单倍型(H001, H002, H003)。这三种单倍型具有显著的地理分化:H001和H002主要分布在UV-B辐射较强的青藏高原主体区域,而H003则主要分布在UV-B最低的青藏高原东部边缘(如四川盆地周边)。群体遗传学分析显示H003与H001/H002之间存在强烈的选择分化。qRT-PCR结果显示,在UV-B处理下,H001和H002单倍型的MAPKKK18基因表达被下调,而H003单倍型的表达则显著上调。这暗示MAPKKK18可能是一个UV-B胁迫响应的负调控因子,其表达下调有利于适应强UV-B环境(图5i-l)。

图5

为进一步验证MAPKKK18的功能,研究进行了基于共同园实验的GWAS分析。测量了197份种质在对照和UV-B处理下的6个生理指标(叶绿素a/b/总含量、类黄酮含量、丙二醛MDA含量、总花青素含量)。GWAS分析结果在Y07染色体前端区域检测到一个显著的关联峰,该峰与GEA鉴定的MAPKKK18基因位置高度重合(图6a,b)。启动子区的第一个SNP(A/G)显示出最强的关联效应,其中H003单倍型对应A等位基因,H001/H002对应G等位基因(图6c-e)。表型数据显示,携带H003单倍型的个体在UV-B处理后,MDA含量(负面指标)显著升高,而其他保护性物质(叶绿素、类黄酮、花青素)含量则显著降低(图6f),这与GEA和qRT-PCR推断的负调控功能一致。双荧光素酶报告实验进一步证明,H003启动子在UV-B诱导下的活性显著高于H001和H002启动子(图6g)。在拟南芥中进行的异源表达实验表明,过表达垂穗披碱草MAPKKK18基因导致拟南芥对UV-B胁迫的抗性降低(表现为敏感表型,生理指标变差),而其T-DNA插入突变体则表现出增强的UV-B抗性(图6h)。这些结果共同证实,MAPKKK18是一个UV-B胁迫响应的负调控因子。启动子区域的单倍型变异通过影响其表达水平,进而调控植株对UV-B的适应性:在高海拔强UV-B地区,选择倾向于使MAPKKK18表达量降低的H001/H002单倍型,从而增强植株的耐受能力。该基因可能代表了一个独立于已知UVR8途径的UV-B响应关键调控节点(补充图28-34,补充数据15-18)。

图6

本研究成功组装并注释了异源六倍体牧草垂穗披碱草的高质量参考基因组,填补了小麦族Y染色体组物种基因组研究的重要空白。系统发育基因组学分析首次明确揭示了小麦族中神秘的Y染色体组与簇毛麦属(Dasypyrum)和偃麦草属(Thinopyum)具有更近的亲缘关系,修正了长期以来关于其起源的认识,并构建了包含St、Y、H染色体组的披碱草属物种的网状进化模型,深化了对小麦族复杂进化历史的理解。群体基因组学分析揭示了垂穗披碱草从横断山起源中心向高、低海拔地区扩散的历史动态,并证明了环境隔离在驱动局域适应中的作用。尤为重要的是,通过整合GEA、GWAS和功能验证,鉴定并证实了关键基因MAPKKK18启动子变异通过调控基因表达水平在垂穗披碱草适应高海拔强UV-B辐射中发挥核心作用。这些发现不仅极大地丰富了我们对异源多倍体基因组进化和植物环境适应机制的认识,而且为利用披碱草属丰富的遗传资源进行牧草和粮食作物的抗逆遗传改良提供了宝贵的基因资源和理论基础。研究所建立的垂穗披碱草基因组数据库(https://elymus.genome.org.cn/)将为后续研究提供重要平台。未来的研究可进一步探索表观遗传修饰、转座子活动等在亚基因组互作和环境适应中的作用。

该研究由四川农业大学草学学科为主要完成单位。Yi Xiong¹、Shuai Yuan²、Yanli Xiong¹、Lizuiyue Li⁴˒⁵和Jinghan Peng¹为共同第一作者。Xiao Ma¹、Yongzhi Yang²、Shiqie Bai⁹和Jianquan Liu⁶为共同通讯作者。(¹四川农业大学草业科技学院;²兰州大学生态学院草地农业生态系统国家重点实验室;⁴西南林业大学国家高原湿地研究中心;⁵西南林业大学云南省高原湿地保护恢复与生态服务重点实验室;⁶四川农业大学小麦研究所;⁹西南科技大学生命科学与工程学院)。该研究得到了国家自然科学基金、国家重点研发计划、四川省重点研发计划、甘肃省重点研发计划、中央高校基本科研业务费、甘肃省研究生创新项目以及四川省“十四五”草品种选育攻关项目等经费的资助。

来源:村姑小仙

相关推荐