摘要:提到蛋白质,大家脑海中浮现的可能是一张张结构精巧、严丝合缝的分子模型图,它们像积木一样拥有固定的三维形状,执行着细胞内精确的功能。但如果告诉你,我们体内那些执行着关键生命功能的蛋白质中,有相当一部分其实是“无形无状”的?它们就是内在无序区域(Intrinsic
提到蛋白质,大家脑海中浮现的可能是一张张结构精巧、严丝合缝的分子模型图,它们像积木一样拥有固定的三维形状,执行着细胞内精确的功能。但如果告诉你,我们体内那些执行着关键生命功能的蛋白质中,有相当一部分其实是“无形无状”的?它们就是内在无序区域(Intrinsically Disordered Regions, IDRs),广泛存在于超过70%的人类蛋白质中。
IDRs缺乏稳定的三维结构,却像柔软的线条一样在细胞中“舞动”,扮演着不可或缺的“分子演员”角色,例如驱动重要的相分离(phase separation)现象,或是与细胞伙伴进行复杂互动。然而,正是这种“无序”特性,让研究人员长期以来困惑不已:它们是如何在没有固定形态的情况下,精准地识别并结合特定伙伴的呢?这种基于化学特异性(chemically specific)的动态相互作用,更是传统的基于结构的方法(如通过深度学习模型预测精确结构)难以预测的难题。耗时的分子模拟虽能一窥究竟,但对于大规模IDRs的快速研究,却显得力不从心。
5月22日一项发表在《Science》杂志上的重磅研究“Sequence-based prediction of intermolecular interactions driven by disordered regions”,为我们揭示了这一谜团背后的惊人发现。研究人员开发了一个名为FINCHES(First-principle INteractions via CHEmical Specificity)的计算框架,它就像一位洞察分子间“化学语言”的“翻译官”,能够直接从蛋白质序列出发,预测IDRs之间的,以及IDRs与折叠蛋白区域之间的“化学对话”模式。
FINCHES的核心在于巧妙地重塑了粗粒化分子力场(coarse-grained molecular force fields)的物理原理,将其转化为一种无需耗时模拟、仅凭序列就能快速、精准解析复杂相互作用的工具。它能以惊人的速度对整个蛋白质组进行高通量分析,每秒处理超过1000个100残基的IDR序列,并且其预测结果具有高度的可解释性,让我们能直接理解相互作用背后的化学驱动力。这项突破性研究不仅成功预测了IDRs的相分离行为、多重交联能力,甚至洞察了磷酸化等翻译后修饰如何精妙地调控IDRs的功能。
这无疑为我们深入理解生命“无形之手”的工作原理,乃至未来蛋白质设计和疾病治疗,开启了全新的大门。
无序之谜:IDRs的“化学特异性”之舞
蛋白质家族中,有些成员像积木一样拥有固定的形状,它们之间的相互作用就像是两块积木精准地拼合在一起,这被称为序列特异性相互作用(sequence-specific interactions),通常会导致一个稳定的、有明确结构界面的结合状态。深度学习(deep-learning)模型在预测这类相互作用方面已经取得了显著进展。
然而,IDRs则不同。它们没有固定的三维结构,却常常以一种更为灵活的方式与伙伴结合,形成无序结合态(disordered bound states)。这种结合并非基于精确的形状匹配,而是由化学特异性(chemically specific)驱动的,即通过IDRs中氨基酸的化学性质(如电荷、疏水性等)与伙伴形成一系列动态的、集成式的结合构象。这就好比柔软的粘土与另一团粘土的相互吸引,而不是精确的模具嵌合。预测这种化学特异性的分子识别,一直是生物物理学领域的一大难题。传统的分子模拟方法虽然能够描述IDRs的生物物理性质,但对于较大的IDRs来说,它们的计算成本极高,速度缓慢,难以进行大规模研究。
那么,有没有一种方法,能够快速、准确地预测IDRs这种“化学感应”式的相互作用呢?
FINCHES的破局:重塑分子力场的智慧
FINCHES的核心思想令人拍案叫绝:既然传统的分子模拟工具(如粗粒化分子力场, coarse-grained molecular force fields)已经能够很好地描述IDRs的生物物理性质,那么我们为什么不能“提取”这些力场中的化学物理原理,并将其转化为一种无需耗时模拟,直接从序列层面预测IDRs相互作用的工具呢?
简单来说,FINCHES将分子力场中描述氨基酸之间吸引或排斥作用的能量函数进行“改造”,通过积分这些势能,计算出一个平均场相互作用参数(mean-field interaction parameter),即ε值。这个ε值就像是一个“化学兼容性分数”:ε值越负,代表相互作用越具吸引力;ε值越正,则代表相互作用越具排斥力。
FINCHES的优势显而易见
快速与分析性:由于是分析性预测而非耗时模拟,FINCHES能够在数分钟内完成对整个蛋白质组的预测,每秒处理超过1000个100残基的IDR序列,这比传统方法快了数千倍。
可调性与可解释性:FINCHES能够根据底层能量函数进行调整,并且由于其基于明确的化学物理原理,每一次预测结果的分子决定因素都清晰可解释,不像某些“黑箱”模型那样难以理解。
高通量与可扩展性:这种能力使得对大规模IDR数据集进行系统性研究成为可能,为理解IDR的功能和设计新的生物分子提供了前所未有的工具。
FINCHES目前集成了Mpipi-GG和CALVADOS2等主流的粗粒化力场。这些力场还允许调节溶液环境,例如盐浓度对相互作用的影响,使我们能够探索更复杂的生物物理现象。虽然FINCHES的预测并非提供原子分辨率的精确数值,但它们为IDR相关的相互作用提供了快速、半定量的描述,极大地推动了该领域的研究。
FINCHES在行动:实证数据揭示无序蛋白的奥秘
FINCHES的提出并非纸上谈兵,它在多项实验验证中展现了惊人的预测能力。
预测IDR的“抱团取暖”:相分离的秘密
IDRs的相分离(phase separation)是近年来生物学领域的热点,它解释了membraneless organelles的形成。FINCHES能够直接从蛋白质序列预测IDRs的相分离趋势。
研究人员通过FINCHES计算了不同IDRs的平均场相互作用参数ε值,并将其输入到Flory-Huggins理论(Flory-Huggins theory)中,从而预测出完整的相图(phase diagrams)。这些相图能够揭示温度和浓度如何影响IDRs的相分离行为。
FUS-LCD变体:研究发现,FINCHES预测的FUS低复杂性结构域(FUS-LCD)变体的ε值与实验测量的光散射第二维里系数(A2 values)之间呈现出高达0.93的良好相关性。实验数据与预测结果在零值处高度一致,表明了FINCHES在捕捉IDRs宏观相互作用特性上的准确性。例如,将野生型FUS中所有酪氨酸(tyrosine)替换为丝氨酸(serine)的变体(FUS-Y2S),FINCHES预测其吸引性相互作用完全被抑制,与实验观察一致。
LAF-1 RGG结构域:对于RNA解旋酶LAF-1的RGG结构域,FINCHES准确预测了其ε值与盐浓度(NaCl)依赖的第二维里系数之间的1:1对应关系,相关性高达1.00,这表明FINCHES能够精确捕捉盐离子如何削弱分子间相互作用。
hnRNPA1-LCD相图: FINCHES成功预测了RNA结合蛋白hnRNPA1低复杂性结构域的相图,包括芳香族残基突变如何影响相分离行为,与此前的模拟和实验结果高度吻合。
DDX4-NTD相图:对于DDX4蛋白的N端IDR,FINCHES不仅能够准确再现不同盐浓度下的相图,还能捕捉到氨基酸序列模式(sequence patterning)对相分离的影响。例如,通过重排带电残基(电荷混洗,charge shuffle)导致相图的变化,以及精氨酸(arginine)替换为赖氨酸(lysine)或苯丙氨酸(phenylalanine)替换为丙氨酸(alanine)完全抑制相分离的突变体,FINCHES都能正确地预测其行为。
蛋白质组层面洞察
研究人员进一步对人类蛋白质组中所有长度大于100个残基的IDRs进行了高通量分析。他们发现,根据Mpipi-GG力场预测,约有10%的IDRs具有同型吸引性ε值(即ε
磷酸化改造IDR功能
FINCHES还揭示了磷酸化(phosphorylation)对IDR相互作用的深远影响。研究人员计算了人类蛋白质组中所有含有磷酸化位点(Ser、Thr或Tyr)的IDRs在磷酸化前后的同型ε值。结果显示,约57%的IDRs在完全磷酸化后,其同型吸引性相互作用减弱;而约30%的IDRs则显示出吸引性相互作用增强。例如,FINCHES预测紧密连接蛋白Zonula Occludens 1(ZO1)的C端IDR在磷酸化后同型相互作用会显著降低,这一预测得到了现有实验数据的强力支持。这些发现表明,翻译后修饰(posttranslational modifications)可以作为“开关”,调控IDR介导的相互作用,从而重新连接它们的生物学功能。
IDR的社交圈:化学特异性与多重交联
除了同型相互作用,IDRs与其他IDRs的异型相互作用(heterotypic interactions)也至关重要。FINCHES使我们能够以前所未有的规模绘制蛋白质组内的异型相互作用图谱。
聚类分析:研究人员对人类蛋白质组中3414个长度在100到150个残基之间的IDRs进行了所有可能的两两异型相互作用计算(约1200万对)。通过层次聚类(hierarchical clustering),FINCHES将这些IDRs分成了24个化学性质相似的相互作用指纹簇(interaction fingerprints)。
吸引性与排斥性:尽管总体上,大多数(约85%)异型IDR-IDR相互作用表现为排斥性(ε值通常为正),但这并不意味着它们不相互作用。令人鼓舞的是,所有IDRs都能与至少一个其他IDR表现出吸引性相互作用。
化学多重交联(chemical promiscuity):FINCHES定义了“化学多重交联”为IDR与多个潜在伙伴发生吸引性相互作用的倾向。通过分析,研究人员发现许多IDRs具有高度的多重交联潜力。在多重交联程度最高的100个IDRs中,大量是RNA结合蛋白(RNA binding proteins),这与它们在细胞内形成复杂RNP颗粒的功能相吻合。
FINCHES还能够将IDRs内部的特定区域(即亚结构域,subdomains)按照化学特异性进行划分,这为传统的IDR结构域研究提供了新的视角。例如,FINCHES成功地将酵母朊病毒蛋白Sup35和BRCA2蛋白的无序区域分解为具有不同相互作用特性的亚结构域,这对于理解这些大型IDRs的功能至关重要,特别是当其相互作用伙伴未知时。
当无序遇上折叠:IDR与折叠域的“化学感应”
FINCHES不仅能预测IDR与IDR之间的相互作用,还能揭示IDR与折叠域(folded domain)表面的“化学对话”。
ProTa:H1复合物:促胸腺肽α(ProTa)和组蛋白H1(H1.0)形成一个完全无序的高亲和力复合物。实验数据表明,H1的C端区域与ProTa结合的亲和力远高于N端区域,解离常数(Ka)分别为0.04 nM和173 nM。FINCHES通过计算ProTa与H1的每残基互作用图谱(per-residue intermaps),成功地捕捉到这种巨大的亲和力差异,预测C端区域的结合强度远高于N端,与实验结果高度一致。同时,FINCHES还预测了这种相互作用对盐浓度的强烈依赖性,也与实验观察相符。
CAPRIN-1同型相互作用: 对于应激颗粒相关蛋白CAPRIN-1的C端IDR片段,FINCHES预测的相互作用热点区域与核磁共振(NMR)实验确定的关键相互作用位点高度吻合。值得注意的是,与DDX4不同,CAPRIN-1的同型相分离在高盐浓度下反而增强,FINCHES也准确地捕捉到了这一反常现象,这揭示了带电残基和芳香族残基之间复杂的相互作用。
Sox2与Nanog:这两种主转录因子通过其C端IDR相互作用。FINCHES不仅识别出驱动相互作用的特定区域和残基,还将其扩展到实验未曾测试的区域。FINCHES甚至能够预测Nanog的C端IDR将发生强烈的同型相分离,这与近期发表的工作一致。
GCN4:Gal11(激活结构域):在酵母中,转录因子GCN4的IDR能够招募共激活因子Gal11,从而驱动基因表达。FINCHES能够通过分析GCN4无序区域与Gal11激活结构域结合表面的相互作用,识别出GCN4中与实验确定的激活结构域(ADs)高度重叠的区域。
然而,高通量实验发现,有些IDRs虽然FINCHES预测它们与Gal11具有强烈的吸引性相互作用,但它们的AD评分却很低,表现出较差的转录激活能力。FINCHES通过进一步分析揭示了这一“矛盾”:这些IDRs同时也被预测具有强烈的同型相互作用,即它们可能倾向于自身组装或与细胞内其他“非目标”伙伴结合,从而阻碍了它们与Gal11的有效结合,进而削弱了转录激活。这一发现与“酸性暴露模型”(acidic exposure model)的解释高度一致,也为理解凝聚体形成与转录输出之间的关系提供了新的视角。
FINCHES——开启IDRs研究新篇章
FINCHES的出现,无疑为IDRs的生物物理研究带来了革命性的变化。它将分子力场的深刻洞察力转化为一个快速、可解释且易于使用的预测工具,使我们能够:
快速生成分子假说:FINCHES能够迅速预测IDR的哪个区域会驱动吸引性或排斥性相互作用,从而指导后续的突变实验设计。
理解进化保守性:帮助研究人员从化学物理角度理解IDRs序列特征的保守性。
定义上下游相关结构域:由于IDR的功能依赖于其相互作用的伙伴,FINCHES能够根据与特定伙伴的相互作用模式,定义IDRs的“上下游相关结构域”。
理性设计IDRs:为合成生物学和药物发现提供新思路,例如设计具有特定相分离或结合性质的IDRs。
当然,正如任何强大的工具一样,FINCHES也有其局限性:它主要捕捉化学特异性相互作用,无法预测序列特异性的、有明确结构界面的结合(这正是AlphaFold等工具所擅长的)。同时,它也无法完全捕捉所有复杂的分子动力学效应,例如溶液中离子对相互作用的精确影响,或某些特殊温度下的行为。此外,FINCHES目前主要针对体外(in vitro)环境下的两两相互作用进行预测,细胞内复杂的体内(in vivo)环境(包括其他分子的竞争、浓度等因素)对IDRs相互作用的影响还需要进一步整合。
然而,这些局限性并非缺陷,而是未来研究的方向,并凸显了FINCHES作为补充性工具的巨大价值。它提供了一个全新且高效的视角,帮助我们理解IDRs如何利用其独特的“无序”特性,通过微妙的“化学语言”与生命分子网络进行深度对话。
好消息是,FINCHES是完全开源的Python软件包,可以在GitHub上找到它( )。此外,它还提供了一个便捷的在线服务器(web server),让你无需编写代码即可进行分析。
IDRs是生命科学中一片充满挑战又充满机遇的“蓝海”。FINCHES作为我们手中的新罗盘,正引领我们深入这片神秘的领域,揭示更多关于生命分子相互作用的奥秘。
参考文献
Ginell GM, Emenecker RJ, Lotthammer JM, Keeley AT, Plassmeyer SP, Razo N, Usher ET, Pelham JF, Holehouse AS. Sequence-based prediction of intermolecular interactions driven by disordered regions. Science. 2025 May 22;388(6749):eadq8381. doi: 10.1126/science.adq8381. Epub 2025 May 22. PMID: 40403066.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
往期热文:
Nature
| 白血病也有“能量饮料”?研究揭示:骨髓基质细胞竟是“牛磺酸供应商”N Engl J Med
| 减重新格局!重磅研究揭秘:替尔泊肽PK司美格鲁肽,谁是真“王牌”?Science | 突破性进展!揭示氯胺酮长效抗抑郁效应的关键“开关”
Science | 揭秘胰腺癌隐形外衣下的“神秘靶点”,免疫治疗迎来新曙光!
Nature | 告别“挨针”?鼻腔疫苗:呼吸道感染的终极防御新策略!
Nature Methods
| 生命蓝图新窗口:二维类胚胎延时培养,首现人类中胚层“乾坤大挪移”全景来源:生物探索一点号1