Nature | 利用大规模定点突变揭示蛋白质稳定性与疾病的关联

360影视 2025-01-10 09:03 2

摘要:在人类基因组中,有超过20000个基因序列是用于编码蛋白质的,这类基因如果发生了错义突变,将影响蛋白产物的结构和功能。其中,近5000种与蛋白质有关的错义突变和单基因遗传病相关,如脊髓性肌肉萎缩症、地中海贫血、白化病等。然而,几乎对所有蛋白质而言,变异对其功能

在人类基因组中,有超过20000个基因序列是用于编码蛋白质的,这类基因如果发生了错义突变,将影响蛋白产物的结构和功能。其中,近5000种与蛋白质有关的错义突变和单基因遗传病相关,如脊髓性肌肉萎缩症、地中海贫血、白化病等。然而,几乎对所有蛋白质而言,变异对其功能的影响目前尚未被充分解析。

2025年1月8日,西班牙巴塞罗那基因组调控中心 (CRG) 联合华大生命科学研究院在Nature上发表了文章Site-saturation mutagenesis of 500 human protein domains,首次通过对522个人类蛋白质结构域的大规模定点突变研究,成功构建了名为“Human Domainome 1”的数据集,揭示了蛋白质稳定性在致病机制中的关键作用。

如果将细胞视为一个小小的建筑工地,氨基酸就像是工地上的原材料,如砖块;肽键就像是将原材料连接起来的“粘合剂”,如水泥;而根据DNA指令所形成的氨基酸序列则像是施工图纸,规定了原材料的排列顺序。

根据不同的“图纸”,氨基酸会连接成各异的多肽串。多肽串又经过弯曲、扣合,折叠成特定的三维结构,才能成为具有生物活性的蛋白质,继而发挥功能。

一条肽链上能独立折叠成紧密而稳定结构的任何氨基酸片段,被称为蛋白质结构域,其作为折叠的功能单元,为研究突变对蛋白质稳定性和功能的影响提供了理想模型。

本研究采用华大自主研发的高通量并行合成技术,构建了包含超过120万种蛋白质结构域突变体的深度饱和扫描突变文库。通过整合高通量测序和蛋白质丰度片段互补实验 (aPCA) 技术,该研究精准量化了突变对蛋白质稳定性的影响,发现突变对蛋白质核心区域的稳定性影响更为显著,而表面区域突变的影响较弱。该研究涵盖了195个全α (螺旋) 、127个全β (折叠) 、47个α+β等多种蛋白质结构类型,以及275个来自人类疾病基因的结构域,其中包含108个已注释的致病突变。

最终数据集中所保留结构域中的结构相似性网络

通过Boltzmann热力学模型,研究发现突变对稳定性的效应在结构同源的蛋白中高度保守。利用该模型,研究进一步预测了7271个蛋白质结构域中的超四百万种突变,涵盖了13878种临床注释突变,包括1310种致病变体和951种良性变体。

分析表明,52%的致病变体均表现出稳定性下降现象。而对整个数据集的分析发现,超过60%的致病性错义突变会显著降低蛋白质稳定性,揭示了蛋白质稳定性在疾病发生中的关键作用。

本研究所建立的高通量突变体库构建与解析能力,不仅提升了对临床突变的解释能力,还为蛋白质家族域的全基因组研究提供了新途径。未来,“Human Domainome 1”数据集有望成为基础科学研究、临床遗传学及药物开发领域的重要工具,推动人类基因组精确注释和精准医学的实现。

本研究由西班牙巴塞罗那基因组调控中心的Antoni Beltran博士担任第一作者,华大生命科学研究院的沈玥研究员和江湘儿副研究员为共同作者,巴塞罗那基因组调控中心的Ben Lehner教授为通讯作者。

制版人:十一

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

来源:小尹讲科学

相关推荐