Nat Biotechnol | 区健辉团队开发基因异构体精准定量新方法miniQuant

360影视 国产动漫 2025-06-05 08:09 3

摘要:真核生物 mRNA 前体可通过可变剪接 ( alternative splicing ) 生成多种基因异构体( isoform ),极大地丰富了 转录本和 蛋白质的多样性。 对基因 异构体的精准定量不仅有助于 深入 解析剪接调控机制,也在疾病研究与临床转化中具

真核生物 mRNA 前体可通过可变剪接 ( alternative splicing ) 生成多种基因异构体( isoform ),极大地丰富了 转录本和 蛋白质的多样性。 对基因 异构体的精准定量不仅有助于 深入 解析剪接调控机制,也在疾病研究与临床转化中具有重要价值。然而,当前 主流 的短读长 RNA 测序技术(如 Illumina )受限 于读长 ,难以 准确 解析结构复杂 、 外显子 高度 共享 的基因异构体, 容易 导致定量误差。 尽管近年来 PacBio 与 Oxford Nanopore Technologies (ONT) 等长读长 RNA 测序 平台 在 基因 异构体 解析 方面取得显著进展,但其高成本与有限测序深度 仍 制约 了低 丰度 转录本的检测与定量准确性。 因此,实现对基因异构体的精准定量, 仍是该领域亟待解决的核心难题 。

2025 年 6 月 3 日 ,美国密歇根大学 ( University of Michigan )区健辉(Kin Fai Au)团队在 Nature Biotechnology 在线发表研究论文 Improving gene isoform quantification with miniQuant ,系统实现了新型基因异构体定量工具miniQuant。该工具创新性地引入“广义条件数”(K值)以量化基因异构体结构复杂性与可区分性,进而判别短读长测序中难以准确定量的基因。随后,miniQuant可针对每个基因及其样本特征,自动设计最优策略融合长读长与短读长数据,从而在全基因组范围实现更为准确、稳健的基因异构体定量。

尽管长读长 RNA 测序技术已问世十余年,相关方法学研究仍主要聚焦于基因异构体的识别,而真正专注于异构体 定量 分析的工具仍相对稀缺。 目前 亦 缺乏系统性评估 来回答一个关键问题 : 长读长测序在 基因异构体 定量中究竟提升了多少 精度 ?哪些基因或场景中提升最 显著 ? miniQuant 的提出正是为了 填补 这一 领域的 空白。 其 包含两个核心功能:( 1 )识别短读长测序难以准确定量的 基因 异构体;( 2 ) 融 合长、短读长数据,实现对这些复杂 基因 异构体的高精度定量。具体而言,作者首先基于 严谨的 数学推导为每个基因计算一个 广义条件数( K 值) ,用于 衡量 其结构复杂性与 异构体间的 可区分性。随后, miniQuant 基于 K 值、异构体结构 特征 和测序读长等, 自动 设计最优策略 以 整合长 、 短读长测序数据, 最终 输出准确 、稳健 的 基因 异构体表达量。

研究团队通过模拟数据、 真实 实验数据 以 及公共数据对 miniQuant 进行 了 系统评估,显示其在 定量 准确性和稳定性方面均优于现有主流工具(如 IsoQuant 、 Bambu )。 进一步地 , 作者 将 miniQuant 应用于人类胚胎干细胞( hESC )向原始生殖细胞样细胞( PGC )分化 模型系统 中,基于 基因 异构体使用率 的 差异分析,识别出多个在分化过程中表达显著变化的关键 基因 异构体。

在 机制层面, miniQuant 还揭示 出 基因 异构体定量误差主要源自两个方面:反卷积误差( deconvolution error )与抽样误差( sampling error )。长读长测序因其 可 覆盖完整转录本,显著 降低了结构复杂( K 值较大 ) 基因 在 读段 归属上 的 不确定 性,从而 有效降低 反卷积误差。然而, 其受限于 测序深度 使其在检测低表达基因异构体时 更 容 易受抽样误差 的 影响。 相较之下 ,短读长测序 拥 有更高 的测序 深度, 能够 缓解抽样误差,但 在结构复杂基因中, 仍面临读段归属模糊的问题 。 miniQuant 通过 融合 长、短读长测序数据的互补优势 ,在这两类误差之间实现有效权衡,最终 显著 提升 了基因异构体 定量 的 准确性。

与 传统方法 相比 , miniQuant 不仅 在 基因 异构体定量性能上表现 优异 ,更首次系统性回答了 三个 关键问题: ( 1 ) 哪些基因异构体可以被准确定量? ( 2 ) 即便在长读长测序下,哪些 基因 异构体仍难以 定量 ? ( 3 ) 长读长数据在定量上具体带来了哪些层面的提升 ? 本研究为利用长读长测序开展基因异构体研究提供了全新范式 。 miniQuant 不仅可为生物学研究者提供 “ 定量可置信度 ” 基因列表,明确指出哪些 基因 异构体表达量具有较高可靠性、哪些需谨慎解读; 还为实验设计提供了实用参考,包括:如何选择 PacBio 或 ONT 测序 平台?采用 cDNA 测序 还是 直接 RNA 测序 策略?如何优化长 、 短读长测序的深度配比以实现最佳性价比?

本研究由美国密歇根大学区健辉教授担任通讯作者,李浩然博士 研究生 、王定杰博士、高琦博士、谭普文博士、王运浩博士和蔡晓 羽 博士为共同第一作者。 目前, miniQuant 已在 GitHub 开源( https://github.com/Augroup/miniQuant ),欢迎有下载使用与反馈建议。

制版人: 十一

学术合作组织

(*排名不分先后)

战略合作伙伴

来源:小黄的科学讲堂

相关推荐