摘要:1月8日,中国农业大学动物科学技术学院李孟华教授团队在国际知名学术期刊《自然·遗传》(Nature Genetics)发表论文《绵羊T2T基因组组装鉴定与毛用性状相关的变异》(Telomere-to-telomere sheep genome assembly
1月8日,中国农业大学动物科学技术学院李孟华教授团队在国际知名学术期刊《自然·遗传》(Nature Genetics)发表论文《绵羊T2T基因组组装鉴定与毛用性状相关的变异》(Telomere-to-telomere sheep genome assembly identifies variants associated with wool fineness),首次完成了中国著名的高繁殖力品种——湖羊的端粒到端粒无间隙基因组组装(T2T-sheep1.0),其中包括完整的Y染色体(T2T-sheep1.0-chrY)和着丝粒区域。
绵羊(Ovis aries)是最早被驯化的家畜之一,其参考基因组的高质量组装对于研究其进化历史、迁徙、遗传多样性以及与特定性状相关的因果突变具有至关重要的意义。由于反刍动物存在大规模的串联重复序列区域(例如端粒、端着丝粒,Y染色体),这些重复序列区域在现有的绵羊基因组上往往缺失或未解析。目前所有已报道的绵羊基因组中均存在数百到数千个未填补的“空白”区域,限制了对绵羊基因组完整性的深入理解。
研究人员利用543.2 Gb的高深度超长ONT(190.4×),149.0 Gb的PacBio HiFi(52.0×),1135.86 Gb的Bionano光学图谱和357.22 Gb的Hi-C测序数据,最终成功组装了完整的绵羊组T2T-sheep1.0,大小为2.85 Gb,QV值达到了51.53。相比当前的绵羊参考基因组Ramb_v3.0,T2T-sheep1.0基因组鉴定了220.05 Mb先前未解析的区域,这些区域主要集中于染色体末端和着丝粒等高度重复区域。
研究人员精准解析了T2T-sheep1.0基因组的着丝粒区域,发现常染色体和X染色体的着丝粒区域主要由高阶重复单元(higher-order repeats, HORs)组成的卫星DNA主导,其中卫星重复序列被分为三类:SatI(816 bp)、SatII(702 bp)和SatIII(22 bp)。SatIII为本研究中新发现的着丝粒单元,荧光原位杂交(FISH)实验验证了它的存在及分布。绵羊的Chr01、Chr02和Chr03三条中着丝粒染色体经历了显著的演化事件,在野生祖先和近缘物种中,非等位同源重组(NAHR)在两条近端着丝粒染色体上发生,从而形成了中着丝粒染色体。通过绵羊、盘羊和山羊的基因组序列追溯染色体重组的过程,发现山羊6条染色体与两种绵羊物种的3条染色体之间存在2:1的融合关系。此外,通过比较NCBI数据库中相关序列,进一步确定了在牛科(Bovidae)和羊亚科(Caprinae)物种中,SatI、SatII和SatIII的序列具有一定的相似性和保守性。
将T2T-sheep1.0鉴定的SNPs用于野生和家养绵羊的种群分析的结果显示,利用T2T-sheep1.0作为参考基因组更正了一些样本在系统发生树和PCA分析中的位置。基于ADMIXTURE(k=10)和FST 的种群遗传结构揭示了家养(六个种群)和野生(四个种群)绵羊种群之间的遗传分化在地理起源上的一致模式。
基于T2T-sheep1.0检测的SNPs和SVs,鉴定不同羊毛细度的家养绵羊种群之间的全基因组选择特征,在非PUR和PUR中分别鉴定了约779个和24个新的受选择基因,如与细毛特征相关的基因TARBP1、EPS8和DMXL2,与毛发发育和毛发弯曲有关的RSPO3和OFCC1等。此外,研究团队研究发现了毛囊分化的关键基因FOXQ1在不同绵羊种群中的等位基因频率变异差异,检测到了显著的选择信号。通过使用PacBio长读长来验证短读长检测到的PUR中的SVs,发现与驯化相关的7个SVs中的5个以及所有与羊毛细度性状选择相关的9个SVs均得到验证。
首个绵羊端粒到端粒的完整参考基因组(T2T-sheep1.0)的组装,标志着在揭示反刍动物基因组中高度复杂且难以解析的重复区域方面取得了重要突破。T2T-sheep1.0在解析绵羊复杂性状的遗传机制、加速品种改良方面具有广泛应用前景,为未来绵羊的功能组学研究提供了坚实的基础。
中国农业大学动物科学技术学院博士生罗凌云、吴慧和兰州大学草地农业科技学院博士生赵利明为共同第一作者,中国农业大学动物科学技术学院李孟华教授、中国农业大学草业科学与技术学院贾善刚副教授和兰州大学草地农业科技学院王维民教授为共同通讯作者。该工作得到了国家生物育种重大科技项目、国家重点研发计划、国家生物育种重大科技项目、国家自然科学基金、中国农业科学院北方农牧业技术创新中心项目、中国科学院战略性先导科技专项和第二次青藏高原科学考察研究项目的资助。数据分析工作得到了中国农业大学高性能计算平台的支持。
来源:小钱讲科学