中农大动科学院刘剑锋教授团队提出畜禽遗传资源精准鉴定新方法——HITSNP

360影视 日韩动漫 2025-08-06 13:50 2

摘要:近日,中国农业大学动物科学技术学院刘剑锋教授团队在国际知名期刊《基因组研究》(Genome Research)上在线发表题为《用于品种多样性评估和血统推断的特征SNP高通量筛选方法》原创性研究成果。

近日,中国农业大学动物科学技术学院刘剑锋教授团队在国际知名期刊《基因组研究》(Genome Research)上在线发表题为《用于品种多样性评估和血统推断的特征SNP高通量筛选方法》原创性研究成果。

我国畜禽种质资源丰富,开展畜禽遗传资源精准鉴定是实现种质资源有效保护和合理利用的重要基础。随着基因组测序技术的快速发展,基于基因组信息的精准鉴定已成为可能。目前品种鉴定中常用的SNP筛选方法(如基于FST等生物信息学指标的方法)在基因芯片数据中应用较多,但对于来源复杂的多品种群体高通量测序数据,这些方法难以将SNP数量有效压缩至实际应用所需的水平。同时,系谱数据缺失也增加了种质资源鉴定的难度。鉴于此,刘剑锋团队研究开发了HITSNP软件用于从高通量数据中筛选具有品种特征的SNP,并基于特征SNP进行品种多样性评估和祖先血统推断。

研究人员开发的HITSNP软件整合了ReliefRR、CCA和MRMR三种特征选择算法,能够从全基因组海量SNP中高效筛选具有品种信息的特征SNP位点。与传统方法相比,其创新性在于同时考虑SNP的品种信息量和冗余度,在不同特征SNP筛选规模下均保持高准确率和稳定性。HITSNP同样包括祖先推断模块,基于机器学习分类器可准确区分纯种与杂种个体,并预测杂种个体的祖先品种来源。

图1 HITSNP软件框架示意图

研究团队通过下载和分析已公开报道的来自全球60个不同猪种的重测序数据集进行新方法性能验证。结果显示HITSNP在不同密度(从60到60,000个特征SNP)的筛选条件下均展现出更高的准确性和稳定性:在仅筛选约60个SNP时仍能保持约0.8的品种鉴定准确率,而传统方法(如选择信号等)在SNP数量低于5,000时性能急剧下降。此外,HITSNP在交叉验证中也表现出较高的Jaccard相似性系数和极低的标准差,证实了其筛选的稳定性。

图2 HITSNP和其他四种筛选方法之间的特征SNP选择性能评估

图3 基于HITSNP筛选的特征SNP进行祖先推断性能评估

此外,研究人员使用最小子集搜索方法对HITSNP筛选的特征SNP数据集进行进一步缩减,探究最小特征SNP子集的可行性。通过比较顺序前向选择(SFS)和递归特征消除(RFE)两种算法,发现SFS策略在保证精度的前提下能更可靠地获得预设数量的特征SNP,特别是在HITSNP-CCA方法与贝叶斯分类器组合下,仅用200个特征SNP即可达到98.56%的测试集准确率。

来源:动保视界

相关推荐