摘要:出生于湖北省孝感市汉川市杨林镇的刘兰,曾经历过高考考入武汉大学的顺遂,也经历过耗时 7 年在中国科学院生物物理研究所完成硕博连读的经历,亦经历过在中山大学医学院从事博士后期间“仅以共同一作身份发表了一篇论文”,再到在美国国立卫生研究院从事博士后期间以第一作者身
出生于湖北省孝感市汉川市杨林镇的刘兰,曾经历过高考考入武汉大学的顺遂,也经历过耗时 7 年在中国科学院生物物理研究所完成硕博连读的经历,亦经历过在中山大学医学院从事博士后期间“仅以共同一作身份发表了一篇论文”,再到在美国国立卫生研究院从事博士后期间以第一作者身份发表一篇 Molecule Cell 和一篇 Nature 。
最近,她的这篇 Nature 一作论文顺利付梓。她告诉 DeepTech:“一路走来,我走了一枚‘学渣’平凡的成长之路。幸运的是,我在 2021 年和 2024 年各收获了一个孩子,为这平凡之路又增添了许多酸甜苦辣和鸡飞狗跳。目前,我还是博士后身份,还有一篇论文需要收尾。暂时打算 2026 年年底回国,目前还在找工作中。”
图 | 刘兰(来源:刘兰)
在这篇 Nature 论文之中, 刘兰和所在团队通过解析两个高分辨率复合物结构并结合功能实验揭示了非同源末端连接如何修复 DNA 末端带有缺口的 DNA 双链断裂。 这个修复过程可以分为两个步骤:第一步聚合酶补齐 DNA 缺口(gap-filling),第二步连接酶连接断口(nick ligation)。
高分辨率数据给研究团队提供了很多重要信息,其中最重要的两点是:(1)聚合酶的招募机制,(2)连接酶和聚合酶的协同反应机制。以前,人们认为不同的酶采取竞争方式独立结合 DNA 末端并对 DNA 进行相应的修复。然而, 本次研究显示连接酶始终结合两条断掉的 DNA 末端,其功能不仅作用于最终的连接阶段,也在 DNA 末端加工阶段辅助其它加工酶结合到 DNA 末端。因此, 本次研究确认了连接酶在非同源末端连接途径中具有多重核心功能,完善了这条通路的功能机制模型。
非同源末端连接是 DNA 双链断裂的主要修复方式,其功能异常与许多疾病相关。比如,许多癌细胞中均发现非同源末端连接蛋白表达水平上调,抑制非同源末端连接可以增加癌细胞对化疗的敏感性。目前,已有针对非同源末端连接抑制剂的药物研发,大多针对蛋白激酶 DNA-PK 和连接酶 LIG4。然而,这类抑制剂的特异性是目前需要克服的主要难题,而针对蛋白相互作用的药物设计不失为另一种可能的选择。
研究团队的高分辨率结构模型清晰地显示了非同源末端连接核心蛋白形成了一个修复平台,招募不同的功能酶协同完成 DNA 修复;阻碍蛋白间关键的相互作用则可能导致这个修复平台不能形成或运转不畅。因此,本次研究结果为针对非同源末端连接抑制剂的设计提供了精确的靶标模型。
另一方面,一些病人由于携带非同源末端连接基因突变,导致遭受多种疾病的折磨,如严重的联合免疫缺陷病、发育障碍、神经系统疾病、癌症等。 根据研究团队解析的非同源末端连接复合物结构模型,可以在分子层面分析部分突变体的发病机制,从而为精准医疗提供依据。
揭示聚合酶的新秘密
基因组 DNA 储存着生命的遗传密码,包含了指导蛋白质和 RNA 生成的所有指令。因此,维持基因组 DNA 稳定性对个体生存和物种繁衍至关重要。然而,每时每刻 DNA 都受到各种外源和内源因素的干扰而产生损伤。比如,紫外线会造成皮肤细胞 DNA 损伤,X 射线等电离辐射也可以导致 DNA 链断裂、碱基改变等。所幸细胞拥有一系列复杂的 DNA 损伤修复通路,包括碱基切除修复、核苷酸切除修复、错配修复、DNA 双链断裂修复等,从而得以维持基因组的稳定性。
在众多 DNA 损伤类型中,DNA 双链断裂对细胞的危害最大,若不能及时且正确的修复,则可能引起 DNA 大片段丢失、突变或重排,大大增加细胞死亡或癌变的风险。深入了解 DNA 损伤修复机制,不仅是对生命的探索,也是为相关疾病的治疗甚至预防提供理论依据。
多年来,刘兰的导师美国国立卫生研究院马丁·盖勒特(Martin Gellert)教授和 杨薇 教授深耕 DNA 损伤修复领域。其中,DNA 双链断裂(DSB,double-strand break)修复是研究团队的一个重点研究方向。非同源末端连接(NHEJ,non-homologous end joining)则是最重要的 DNA 双链断裂修复途径之一,负责修复大于 80% 的 DNA 双链断裂;另外,非同源末端连接还是抗体和 T 细胞受体基因形成过程中必不可少的一环。因此,非同源末端连接受损的病人往往有不同程度的免疫疾病。
非同源末端连接途径大致可分为 DNA 断口识别、断口加工和连接三个步骤,由 30 多种蛋白协同完成。这些蛋白根据功能的不同被分为核心蛋白、末端加工蛋白和辅助蛋白。其中核心蛋白的研究最为深入,它们可独立修复含平末端或粘性末端的 DNA 双链断裂。然而,真实的 DNA 双链断裂损伤往往伴随着 DNA 末端碱基或结构破坏,需要加工酶(核酸酶、聚合酶、末端修正酶等)处理后才能被连接酶识别,而这部分的研究相对匮乏。因此,研究团队以聚合酶为研究对象,旨在揭示聚合酶如何被招募参与非同源末端连接并与其它蛋白协同完成 DNA 双链断裂修复。
自行挑错“震惊”审稿人
刘兰表示:“这个课题从 2022 年开始,2024 年 7 月投稿,2025 年 4 月论文被 Nature 接受。”累计耗时大约三年左右。
在研究第一阶段,他们重组表达并纯化相关的非同源末端连接蛋白,并一共获得 8 种非同源末端连接蛋白,有些使用简单的原核体系表达,有些则需要使用哺乳细胞表达系统。由于研究团队实验室一直在做 DNA 损伤修复方面的工作,因此纯化这些蛋白并没有花费太多时间。
在研究的第二阶段,他们筛选了参与 gap-filling 和 ligation 的蛋白成分。研究团队用不同的蛋白组合做酶活实验来观察哪种组合能最高效的完成 DNA 修复,从而确定哪些蛋白能够形成功能复合物。
在研究的第三阶段,研究团队针对实验条件进行优化,例如缓冲液的离子浓度、pH 值、添加剂等,从而得到更高的酶活效率,因为更高的酶活预示着可能有更多的蛋白形成了功能复合物。
在研究的第四阶段,他们根据酶活实验确定的条件,用单颗粒冷冻电镜技术捕捉复合物。 这个复合物涉及 16 条蛋白链、大约 1MDa 分子量。其主体结构松散、各部分之间柔性很大。直接冷冻样品并不能得到完整复合物,为此,研究团队使用了交联剂稳定复合物,并通过交联剂浓度优化和冻样条件优化,最终将分辨率推至 3Å 左右,足够他们搭建精准的结构模型。
在研究的第五阶段,他们针对模型提供的结构信息做了一些功能实验,使得结构与功能相互支撑,从而使本次结论更加可信。
但是,刘兰表示:“我觉得比较幸运的是我们在论文返修阶段发现了一个致命疏漏,避免了论文发表后再更正或撤稿的尴尬。”
三位审稿人的第一轮意见特别正面,唯一的一个主要关切是研究团队的生化实验结果中 XRCC4 类因子(XLF,XRCC4 like factor)蛋白功能偏弱,与以前发表的论文结果不完全一致。返修时,研究团队花了两个月的时间反复重复实验或优化实验条件,但始终只能重复之前的结果。
通过对各种因素逐一排查,最终发现他们使用的 XLF 蛋白 C 末端降解了 20 多个氨基酸导致 XLF 功能受损。这个蛋白表达时融合了麦芽糖结合蛋白(MBP,Maltose-Binding Protein)纯化标签,在纯化过程中需使用 PreScission 蛋白酶将 MBP 标签切除。让人意外的是 XLF 序列中含有一个弱的 PreScission 蛋白酶识别位点,导致 XLF C 末端也被意外切除。由于这个截断体与全长蛋白的分子量很接近,研究团队并没有通过 SDS-PAGE 胶或分子筛出峰位置发现其异常,这也导致了功能实验结果与相关文献的结果有点出入。
发现问题之后,他们优化了纯化方法并得到了全长 XLF 蛋白。果不其然,全长 XLF 蛋白促进非同源末端连接效率的功能大大增强。于是,研究团队又花费四个月时间,用全长蛋白将所有的结构和功能实验全部重做。“所幸那个降解片段并没有影响复合物的全局构象,对论文结论没有影响。”刘兰表示。
由于蛋白纯化的这点疏忽,导致一个“小修”的论文变成了重做。“返修后,审稿人也被我们的操作震惊了, 并感叹于如此之大的工作量。这个教训让我深刻体会到魔鬼确实藏在细节中,往后切不可麻痹大意。”刘兰说。
最终,相关论文以《动态组装与非同源末端连接协同反应》(Dynamic assemblies and coordinated reactions of non-homologous end joining)为题发在 Nature ,刘兰是第一作者,马丁·盖勒特(Martin Gellert)教授和 杨薇 教授担任共同通讯作者。
图 | 相关论文(来源: Nature )
如前所述,本次研究结果显示非同源末端连接核心蛋白会形成一个修复平台,招募不同的酶参与修复 DNA 损伤末端。目前,研究团队研究了聚合酶的作用机制。基于此,该团队计划进一步完成其它末端修复酶的组装和协同机制研究, 以便全面揭示 NHEJ 这一重要复杂且精妙的分子过程。
来源:东窗史谈一点号