bioRxiv | 大麦泛基因组分析揭示了与育种相关的生长素响应因子(ARF)的隐藏多样性和选择信号

360影视 国产动漫 2025-09-14 19:10 1

摘要:生长素响应因子(Auxin Response Factors, ARFs)是植物特有的一类转录因子家族,在生长素信号转导通路中扮演着“指挥官”的角色。它们通过调控下游基因的表达,广泛参与植物的器官建成、胚胎发育、开花结实等几乎所有生命过程。在水稻、玉米等重要禾

生长素响应因子(Auxin Response Factors, ARFs)是植物特有的一类转录因子家族,在生长素信号转导通路中扮演着“指挥官”的角色。它们通过调控下游基因的表达,广泛参与植物的器官建成、胚胎发育、开花结实等几乎所有生命过程。在水稻、玉米等重要禾本科作物中,多个ARF基因已被证实能够调控粒重、穗型等关键农艺性状,展现出巨大的育种应用潜力。大麦作为世界第四大谷物作物和最早被驯化的农作物之一,其ARF基因家族的功能多样性与进化历程却长期未被系统解析。随着高通量测序技术的发展,特别是泛基因组学和泛转录组学等多种组学资源的涌现,为我们在群体水平上全面、深入地解析基因家族的遗传变异、进化动态及其与重要农艺性状的关联提供了前所未有的机遇。

德国莱布尼茨植物遗传与作物研究所(IPK)的Thorsten Schnurbusch团队在预印本平台bioRxiv发表题为“Pan-genome Analysis Reveals Hidden Diversity and Selection Signatures of Auxin Response Factors (ARFs) Associated with Breeding in Barley”的论文。该研究整合了多组学数据,对76份不同来源大麦的ARF基因家族进行了迄今为止最全面的泛基因组分析,系统揭示了该基因家族在群体水平的结构变异、进化动态和表达调控模式,并鉴定出一个在欧洲大麦育种过程中受到强烈选择、显著影响籽粒大小的关键基因HvARF3的优异等位基因。

大麦ARF基因家族的泛基因组鉴定与结构变异

研究团队首先基于76份大麦的泛基因组数据,采用基于蛋白结构域的策略,共鉴定出1911个ARF编码基因,经过严格筛选后保留了26个核心ARF基因用于后续分析。这一数量比以往基于单个参考基因组的研究多出约30%,凸显了泛基因组在捕获基因家族完整多样性方面的巨大优势。根据这些基因在不同大麦材料中的存在频率,研究者将其划分为核心基因(存在于所有材料)、软核心基因(存在于≥95%的材料)和非必需基因(存在于10%-95%的材料)。结果显示,约80.7%的HvARF基因属于核心或软核心基因,表明它们在大麦生长发育中发挥着不可或缺的基础性作用(图1A, E)。

图1

然而,HvARF13进化分支表现出显著的结构变异,包括存在/缺失变异(PAV)和拷贝数变异(CNV)。其中,HvARF13-3高度保守,而HvARF13-1HvARF13-2则在群体中呈现动态变化,暗示了该分支可能正在经历快速的基因复制、丢失以及功能分化事件(图1B)。此外,研究人员还根据ARF蛋白中部区域的氨基酸组成,将其划分为转录激活子(富含谷氨酰胺)和转录抑制子(富含丝氨酸/苏氨酸/脯氨酸),为后续功能预测奠定了基础(图1C, D)。

系统发育与选择压力分析揭示ARF基因的进化动态

通过构建系统发育树,研究发现大麦ARF蛋白的进化关系与其他物种基本一致。比较基因组学分析揭示,与双子叶植物拟南芥相比,禾本科的代表水稻和大麦在进化过程中丢失了多个ARF基因,这可能反映了单子叶植物在生长素信号调控策略上的简化和特化。有趣的是,AtARF5分支在三个物种中均保留为单拷贝直系同源基因,暗示其在植物界中具有极端重要且不可替代的功能。与水稻相比,大麦在多个ARF分支上发生了基因扩张,尤其是在已知的负调控因子AtARF17/16/10同源分支中,这可能与大麦适应更广泛环境的进化需求有关(图2A, B)。

图2

为了评估不同ARF基因在进化过程中受到的选择压力,研究计算了非同义替换率(Ka)与同义替换率(Ks)的比值(Ka/Ks)。结果显示,绝大多数HvARF基因的Ka/Ks远小于1,表明它们受到了强烈的纯化选择,其核心功能在进化中被严格保留。从野生大麦到地方品种再到现代栽培种,纯化选择的强度逐渐增强,反映了人工驯化和育种对关键基因功能的“精雕细琢”。值得注意的是,HvARF12在栽培品种中表现出适应性进化的迹象,这可能与其在农艺性状和抗逆性之间的平衡调控有关(图2C, D)。

转座元件(TE)对ARF基因表达的顺式调控作用

转座元件是基因组中的“跳跃”遗传因子,它们可以通过插入到基因附近来影响基因的表达。研究发现,在HvARF基因的上下游区域富集了大量的转座元件,特别是反转录转座子,且它们倾向于分布在基因上游约20-50 kb的位置,这是启动子和增强子等关键调控区域的“热点地带”(图3A, B)。

图3

为了验证这些转座元件是否真正发挥调控作用,研究团队整合泛基因组和泛转录组数据,进行了表达数量性状位点(eQTL)分析。分析发现,基因表达的变异主要由组织特异性和基因型-组织互作效应驱动(图3C)。多个HvARF基因(如HvARF20HvARF25等)检测到了强烈的顺式eQTL信号,即基因附近的遗传变异显著影响了其自身表达水平。特别地,HvARF25基因的eQTL峰值位置恰好与一个反转录转座子的插入位点重合,为转座元件作为顺式调控元件提供了有力证据(图3D, E)。

ARF基因的时空表达特异性与功能网络

利用覆盖多个组织和发育时期的泛转录组数据,研究揭示了HvARF基因具有高度的时空表达特异性。其中,花序是ARF基因表达最活跃且基因型间差异最大的组织,超过半数的ARF基因在穗分化关键时期(W6-W7期)高度表达,暗示它们在调控小穗和花器官发育中发挥核心作用(图4A, B)。为了进一步精确解析其功能,研究利用单细胞转录组数据,将ARF基因的表达定位到具体的细胞类型。例如,HvARF4基因在多种细胞中广泛表达,可能扮演“多面手”角色;而HvARF11则特异地在由三联小穗分生组织向小花分生组织过渡的细胞中表达,可能是一个关键的发育“开关”(图4C)。

图4

通过加权基因共表达网络分析(WGCNA),研究还揭示了与每个HvARF基因协同工作的“伙伴”基因模块。功能富集分析显示,这些模块大多与转录调控相关,符合ARF作为转录因子的身份。有趣的是,HvARF3HvARF14HvARF15的共表达网络富集了与真菌防御反应相关的基因,这与它们在水稻中的同源基因功能一致,表明该分支的ARF蛋白可能在生长发育与抗病反应的协同进化中扮演重要角色(图4D)。

HvARF3被鉴定为大麦育种的关键选择靶点

为了挖掘在驯化和育种改良过程中受到人工选择的ARF基因,研究团队进行了选择性清除分析。在26个ARF基因中,HvARF3HvARF8-2等五个基因所在的基因组区域显示出强烈的选择信号,其等位基因频率在野生和栽培群体间存在显著差异(图5A)。

图5

进一步的功能预测分析将焦点锁定在HvARF3基因上。该基因存在一个非同义突变(R475G),被预测对蛋白功能有重大影响。系统发育分析也证实,HvARF3及其旁系同源基因HvARF14HvARF15均表现出与驯化状态相关的谱系特异性聚类,表明该进化分支是人工选择的“热点”(图5B, C)。全基因组关联分析(GWAS)和单倍型分析最终证实了HvARF3的功能。携带“R475”等位基因的单倍型主要富集于欧洲栽培品种中,并且与显著增大的籽粒面积和千粒重相关。这一结果表明,“R475”是一个与高产相关的优异等位基因,在欧洲现代大麦育种中受到了青睐和富集(图5D)。为便于育种应用,研究者还开发了能够特异性检测R475G变异的dCAPS分子标记。

本研究通过整合泛基因组、泛转录组、选择性清除和关联分析等多重组学证据,系统地描绘了大麦ARF基因家族的进化蓝图和功能图谱。研究不仅揭示了该家族在群体水平的丰富遗传多样性和复杂的进化历史,更成功地鉴定出一个与粒重性状紧密关联、并在育种中受到正向选择的关键基因HvARF3及其优异单倍型。

研究结果表明,与水稻中直接调控籽粒发育的ARFs不同,大麦中的ARF基因主要通过在花序发育早期调控器官建成和细胞分裂来间接影响最终的籽粒大小。这一发现为理解大麦产量形成的分子机制提供了新的视角。此外,HvARF3优异单倍型在亚洲大麦中稀有,可能与区域性的遗传瓶颈或生长发育与抗逆性之间的功能权衡有关,这为跨区域种质资源的高效利用和优异基因的聚合育种提供了重要线索。本研究不仅为大麦的分子育种提供了宝贵的基因资源和分子工具,也为在其他作物中利用多组学数据深度挖掘基因家族功能提供了成功的范例。

来源:唔話柯説

相关推荐