摘要:蛋白质是至关重要的分子机器,为生物体中无数的过程提供动力。它们帮助将阳光转化为能量,通过抵抗病毒来支持免疫系统,等等。每种蛋白质都由一条氨基酸链组成,这些氨基酸链选自 20 种不同的氨基酸。即使是一个相对较短的蛋白质,仅由 60 个氨基酸组成,理论上也能以 1
蛋白质可能比我们想象的要坚固得多。一项新研究表明,只有少数氨基酸对蛋白质的核心结构至关重要,这为更快、更大胆、更可靠的蛋白质设计打开了大门。
一项大规模实验揭示了控制蛋白质稳定性的基本规则,为更快地开发药物和酶打开了大门。
蛋白质是至关重要的分子机器,为生物体中无数的过程提供动力。它们帮助将阳光转化为能量,通过抵抗病毒来支持免疫系统,等等。每种蛋白质都由一条氨基酸链组成,这些氨基酸链选自 20 种不同的氨基酸。即使是一个相对较短的蛋白质,仅由 60 个氨基酸组成,理论上也能以 10⁷8 种不同的方式组装——这个数字之大,堪比已知宇宙中原子的总数(称为“五万亿亿亿”)。
这种惊人的复杂性引出了一个根本问题:进化是如何选择出那些稀有的氨基酸组合,从而产生不仅能正确折叠、还能保持稳定并执行基本功能的蛋白质的?科学家们也在探索能否揭示这些进化规则,以帮助现代研究人员设计更有效的药物和环境友好的催化剂。发表在《科学》杂志上的一项新研究为这两大挑战提供了充满希望的见解。
每个蛋白质内部都有一个紧密堆积的核心,支撑着其三维结构。而外层表面则负责与其他分子的大部分相互作用。多年来,科学家们认为,改变核心的任何部分都如同篡改建筑物的支撑梁。一个小小的失误就可能导致整个结构坍塌。由于核心的氨基酸紧密堆积,因此,即使微小的变化也可能扰乱邻近区域,从而引发整个蛋白质结构破坏的连锁反应,这似乎是合理的。
按照这种经典的蛋白质稳定性理论,蛋白质基本单元的大多数变化都会触发隐藏的陷阱,并可能导致整个结构变形。考虑到可能的组合数量之多,进化找到一条安全路径创造新蛋白质的可能性似乎微乎其微。
这项研究彻底颠覆了这一想法。巴塞罗那基因组调控中心(CRG)和英国欣克斯顿威康桑格研究所的研究人员研究了一个名为 FYN-SH3 的人类蛋白质结构域(蛋白质的功能位),制造了数十万种变体,并测试哪些变体仍然折叠并起作用。
实验表明,SH3 在数千种不同的核心和表面组合中仍能保持其形状和功能。蛋白质核心中仅存在少数真正的承重氨基酸。
“我们的数据挑战了蛋白质是一座精致的纸牌屋的教条。支配其稳定性的物理规则更像是乐高而不是叠叠乐,一块砖头的改变可能导致整个结构倒塌,这是一种罕见且至关重要的可预测现象,”该研究的第一作者、基因组调控中心的博士后研究员阿尔伯特·埃斯科贝多(Albert Escobedo)博士解释道。
随机的核心(金色和黑色)和表面(银色)残留物。图片来源:Albert Escobedo/Centro de Regulación Genómica
研究团队利用实验产生的大量数据,测试从一种蛋白质中学习规则是否有助于解释自然界中所有相关蛋白质的进化。他们将数据输入机器学习算法,从而创建了一种可以预测 SH3 序列是否保持稳定的工具。
自大约十亿年前的早期多细胞生命以来,SH3 结构域就一直在不断多样化。研究人员将他们的模型与公共数据库中涵盖整个生命树(包括细菌、植物、昆虫和人类)的 51,159 个天然 SH3 序列进行了比较。该算法正确地将几乎所有 SH3 结构域标记为稳定,即使测试序列与人类版本的序列共享程度不到四分之一。
“进化并不需要筛选整个序列宇宙。相反,折叠的生化定律为自然选择创造了一个广阔而宽容的环境,”埃斯科贝多博士说。
蛋白质工程领域目前依赖于公司筛选数千种具有最小变化的蛋白质变体,每次缓慢地进行一些改变,这使得新酶、药物和疫苗的设计变得缓慢而昂贵。
证实蛋白质稳定性遵循比以前认为的更简单的规则可以缩短蛋白质设计的反复试验阶段,为开发具有医疗或工业应用的蛋白质(例如更环保的催化剂或更持久的药物)节省大量时间和精力。
例如,治疗性酶常常因为其表面会引发免疫反应而失败。重塑这些蛋白质表面是一项耗费大量人力的工作,需要反复试验才能避免支架坍塌,破坏原本有希望的设计。现在,蛋白质工程师可以在计算机上提出更大胆的设计方案,包括同时进行数十项修改,走进实验室后,他们就已经知道哪些变体最有可能通过折叠和功能测试。
“预测和模拟蛋白质进化的能力为以工业速度进行生物学设计打开了大门,挑战了蛋白质工程的保守节奏,”加泰罗尼亚研究和高级研究机构(ICREA )研究教授本·莱纳(Ben Lehner)解释道,他是这项研究的通讯作者,同时隶属于基因组调控中心 (CRG) 和威康桑格研究所。
参考文献:Albert Escobedo、Gesa Voigt、Andre J. Faure 和 Ben Lehner 合著的《核心和表面随机化的蛋白质的遗传学、能量学和变构效应》,2025年7月24日,《科学》。DOI:10.1126/science.adq3948
来源:康嘉年華一点号