摘要:DNA并非赤裸裸地存在,它被一层由复杂蛋白质(proteins)和核糖核酸(RNA)组成的“染色质”(chromatin)凝胶紧密包裹。在这片分子丛林中,只有极少数“特权”蛋白质能够真正“零距离”触及DNA,并直接参与到基因的开启、关闭以及细胞命运的决定中。
DNA并非赤裸裸地存在,它被一层由复杂蛋白质(proteins)和核糖核酸(RNA)组成的“染色质”(chromatin)凝胶紧密包裹。在这片分子丛林中,只有极少数“特权”蛋白质能够真正“零距离”触及DNA,并直接参与到基因的开启、关闭以及细胞命运的决定中。
然而,长期以来,要精准捕捉这些DNA的“亲密伴侣”,并揭示它们是如何与生命密码直接对话的,一直是摆在研究人员面前的巨大挑战。传统的甲醛交联(formaldehyde crosslinking)法,虽然能“固定”这些互动,却如同在模糊的滤镜下拍照,蛋白质与蛋白质、蛋白质与核糖核酸的间接交联使得真假难辨;而普通紫外光交联(UV-crosslinking),又往往效率低下,难以实现活细胞(living cells)内的“即时快照”。这些局限性严重阻碍了我们对活细胞中蛋白质-DNA直接相互作用图谱的全面认知。
5月22日《Cell》的颠覆性研究“The human proteome with direct physical access to DNA”,为我们打开了一扇通往DNA核心世界的新窗户——“零距离光交联”(zero-distance photo-crosslinking)技术!这项创新技术,犹如为分子生物学装上了高精度显微镜和高速摄像机,通过巧妙的代谢标记(metabolic labeling)和自主研发的高强度紫外发光二极管(UV-LED)照射系统,首次实现了在活细胞内,以惊人的单氨基酸分辨率(single-amino-acid resolution)和分钟级别(minutes timescale)的时间尺度,定量分析蛋白质与DNA的直接物理接触。
它不仅揭示了此前未知的DNA互作蛋白质组(DNA-interacting proteome)的全面图景,发现了大量具有高度“无序区域”(Intrinsically Disordered Regions, IDRs)的蛋白质在DNA结合中的关键作用;还让我们得以追踪雌激素受体(ESR1)等转录因子(transcription factors)如何响应外部信号而迅速“奔赴”DNA,以及DNA修复(DNA repair)蛋白如何在分秒间“抢救”受损基因。这项突破性工作无疑为探索基因组的精细调控网络、解析疾病发生机制,乃至开发下一代靶向药物,提供了前所未有的强大工具和无限可能。
颠覆性工具:零距离光交联的诞生与威力
这项研究的核心在于其创新性的“零距离光交联”技术。为了实现对活细胞内蛋白质-DNA相互作用的高效、特异性捕捉,研究团队进行了多方面的优化和创新。
光敏核苷酸的巧妙运用
首先,他们通过代谢标记(metabolic labeling)的方式,将一种光活化核苷酸——4-硫代胸苷(4-thiothymidine, 4ST)——掺入到活细胞的DNA中。与DNA天然碱基(natural DNA bases)在254nm紫外线(UVC)下反应活性较低不同,4ST在365纳米(UVA)光照下具有更高的光反应性。研究团队发现,365纳米的紫外光(UVA)能够有效激活4ST,同时最大程度地避免了对细胞内天然DNA和蛋白质的附带损伤,这使得DNA本身能够作为后续纯化的“把手”。
高强度紫外照射系统的铸就
为了实现快速、高效的光活化,研究团队自主研发了一款名为“UVEN”(UV irradiation system for enhanced photo-activation in living cells)的高强度365纳米紫外发光二极管(UV-LED)照射装置。这款装置的威力令人惊叹:与传统灯泡(bulb-based)紫外照射装置相比,UVEN能够发出高出三个数量级的能量,这意味着它可以在极短时间内(例如数秒)完成光交联。数据显示,UVEN能够在大约100倍的速度下激活4ST,而传统的紫外灯泡则效率低下得多。此外,UVEN的照射面积达到了约175平方厘米,比之前基于激光的系统大600多倍,这使得它能够均匀地照射更大面积的细胞培养皿,极大地提升了实验的通量(throughput)。
在对人类乳腺癌细胞(MCF7 cells)和骨肉瘤细胞(U2OS cells)的实验中,研究发现,即使是短短6秒的UVEN照射,配合超过100µM的4ST标记,就足以有效抑制细胞增殖。更重要的是,未标记的对照细胞即使在60秒的UVEN照射下也能持续增殖,这表明天然DNA在此波长下几乎不受损伤,且细胞在照射过程中仍保持活性。与常用的4SU(4-thiouridine)相比,4ST在细胞中耐受性更好,半抑制浓度(IC50)约为1-2.5mM,而4SU仅为100-200µM,这使得研究团队能够使用更高浓度的4ST进行标记,进一步提高交联效率,同时将对细胞的毒性降到最低。在后续的实验中,他们选择了100微摩尔的4ST浓度,并进行1分钟的UVEN照射,以在冰冷的PBS(phosphate-buffered saline)中“冻结”相互作用,并抑制细胞对交联产生的瞬时响应。
创新纯化流程:XDNAX的精妙设计
光交联完成后,如何从复杂的细胞组分中高效、纯化地分离出与DNA交联的蛋白质,是这项研究成功的关键。研究团队为此开发了一套名为“蛋白质交联DNA提取”(protein-crosslinked DNA extraction, XDNAX)的多步变性纯化方案。
XDNAX流程的巧妙之处在于,它利用了经典的硫氰酸胍-苯酚-氯仿(TRIZOL)提取方法,最初用于核酸纯化。通过对TRIZOL中间相(interphase)的额外处理,研究团队能够有效去除大部分非交联蛋白质、核糖核酸、脂质(lipids)和其他细胞碎片。随后,他们对含蛋白质交联DNA的提取物进行超声破碎(ultrasonication),并通过高温变性(denaturing)和硅胶自旋柱(silica spin columns)的强力洗涤,进一步彻底去除残余的非交联蛋白质。最终,通过核酸酶(nuclease)处理将蛋白质从DNA上释放,并进行胰蛋白酶(trypsin)消化,以便进行液相色谱-质谱(LC-MS)分析。
为了验证XDNAX的纯化效率,研究团队采用了稳定同位素标记细胞培养(SILAC)技术。他们将用重同位素(SILAC heavy)标记并经UVEN照射的MCF7细胞与用轻同位素(SILAC light)标记且未经照射的对照细胞混合,然后进行XDNAX处理。结果令人振奋:在所定量的1803种蛋白质中,有1026种蛋白质的富集倍数超过10倍,甚至有876种蛋白质仅在受照射的SILAC通道中被检测到,这表明背景非交联蛋白质几乎被完全清除。当省略4ST标记并使用未标记细胞进行相同的实验时,这种富集效果则完全消失,这进一步证明了XDNAX的特异性。
GO分析显示,在XDNAX后仅在受照射SILAC通道中发现的蛋白质,其核酸结合(nucleic acid binding)功能、特别是DNA结合(DNA binding)功能,富集度极高,p值分别达到了1E-149和1E-120。这与研究的预期高度一致。此外,研究团队还意外地在XDNAX样本中鉴定出了大量的核苷酸交联肽(nucleotide-crosslinked peptides),这些肽段在未经额外富集的情况下就能被检测到,为表征蛋白质-DNA相互作用界面提供了额外的证据。这项研究共发现了688个核苷酸交联肽,对应着379种不同的蛋白质——这一数字是此前报道的同类研究的20倍,标志着巨大的技术飞跃。其中,一个额外增加321Da质量的修饰( phosphorylation of 4ST minus a water molecule)被确认为4ST交联的直接证据,这一修饰仅在受照射的样本中出现。
揭示基因组的“亲密图谱”:DNA互作蛋白质组的全面画像
这项研究首次绘制了人类乳腺癌细胞(MCF7 cells)中与DNA直接物理接触的蛋白质图谱,为我们理解基因组的复杂调控网络提供了前所未有的深度。
DNA互作蛋白质组的广度与组成
研究团队通过对五次重复实验的分析,共发现了1805种候选DNA互作蛋白质,其中有1191种在至少三次重复实验中稳定存在,形成了一个可靠的DNA互作蛋白质组(DNA interactome)核心列表。这个图谱与已有的深层细胞核蛋白质组(deep nuclear proteome)有很大的重叠,83%的蛋白质在细胞核中被检测到。
通过iBAQ(intensity-based absolute quantification)定量分析,研究发现,在DNA互作蛋白质组中,组蛋白(histones)仍然是丰度最高的蛋白质,对总iBAQ贡献最大,这符合组蛋白作为DNA骨架蛋白(scaffold proteins)的已知功能。此外,研究还发现:
功能多样性: 60%的DNA互作蛋白质具有核酸结合功能,特别是DNA结合和序列特异性DNA结合(sequence-specific DNA binding)功能。除了已知的DNA结合蛋白,研究还发现了层粘连蛋白(lamins)等细胞核骨架蛋白,以及大量参与染色质组织(chromatin organization)和细胞分裂(cell division)的蛋白质。
“未知”的力量:令人惊讶的是,研究团队还鉴定出了一组278种无法归类到主要GO术语(main GO terms)的蛋白质,其中包括泛素-蛋白酶体系统(ubiquitin-proteasome system)的成员,如PSM3,它们可能参与了细胞周期进程、细胞凋亡(apoptosis)和DNA修复中蛋白质的降解。更引人注目的是,其中一种未被表征的蛋白质C5orf24,其整个序列构成了一个未知功能的单一结构域(domain),并且高度无序。这提示我们,可能存在许多尚未被发现的、通过独特机制与DNA相互作用的蛋白质。
结构特性揭示:无序区域的关键角色
染色质在活细胞中表现出固态性质,为蛋白质和核糖核酸提供了核小体(nucleosome)支架,形成了一个弹性凝胶。研究团队深入探究了DNA互作蛋白质的结构特征,以了解它们是如何直接接触DNA的。
无序区域(Intrinsically Disordered Regions, IDRs)的普遍性:这是这项研究最重要的发现之一。研究发现,DNA互作蛋白质组中的蛋白质表现出最广泛的内在无序性。与深层核蛋白质组和细胞质蛋白质组相比,DNA互作蛋白质的无序区域平均长度最长。数据显示,DNA互作蛋白质的无序区域平均长233个氨基酸,而甲醛交联染色质(formaldehyde-crosslinked chromatin)中的蛋白质平均长154个氨基酸,核内蛋白质平均仅有121个氨基酸,细胞质蛋白质更是只有49个氨基酸。这意味着,这些高度灵活、没有固定三维结构的无序区域,在蛋白质与DNA的“亲密接触”中扮演着至关重要的角色。
特定氨基酸重复序列的富集:研究还发现,特定的同聚氨基酸(homopolymeric amino acid)序列(例如含有谷氨酸、脯氨酸、丝氨酸、甘氨酸、赖氨酸和精氨酸的五肽序列)在DNA互作蛋白质中显著富集。数据显示,这些特定的五肽序列在DNA互作蛋白质中占36%的蛋白质,而细胞质蛋白质中仅占13%。这些重复序列通常与蛋白质的内在无序性相关联。
功能结构域(functional domains)的洞察:研究团队还发现,许多经典的DNA结合结构域(DNA-binding domains)和组蛋白结合结构域(histone-binding domains),如PHD型(PHD-type)和C2H2型锌指(C2H2-type zinc finger)、SAP结构域(SAP domain)以及DEAD/DEAH盒解旋酶(DEAD/DEAH box helicase)等,在DNA互作蛋白质中显著富集。
意外的发现:RNA识别基序(RRM)与DNA的交集: 令人惊讶的是,通常与RNA结合相关的RNA识别基序(RNA recognition motif, RRM)结构域,也在DNA互作蛋白质中显著富集。研究团队能够识别出多个含有RRM结构域的蛋白质(如MATR3、TRA2B、SRSF2、SRSF11和RNPS1)与DNA的交联位点,这暗示了RRM结构域在活细胞中也可能与DNA相互作用。这可能是因为一些蛋白质在相分离区室(phase-separated compartments)内,能够同时接触RNA和DNA,从而产生这种“意外”的直接相互作用。
蛋白质-DNA相互作用模式的汇总
这项研究总结了蛋白质与DNA的四种主要相互作用模式:
球状DNA结合结构域(globular DNA-binding domains): 蛋白质通过特定的、具有稳定三维结构的区域直接与DNA结合。
DNA结合内在无序区域(DNA-binding IDRs): 蛋白质通过其灵活的、无序的区域与DNA直接接触。
环境邻近性(circumstantial proximity): 蛋白质通过与组蛋白(histone-binding proteins)或其他蛋白质(如剪接因子,splicing factors)的相互作用,间接地靠近DNA。
相分离区室(phase-separated compartments)内:蛋白质在特定的相分离区室(如核仁,nucleolar proteins)内,可能由于局部高浓度或特殊环境而与DNA发生非特异性相互作用。
这些发现极大地丰富了我们对蛋白质-DNA相互作用多样性的理解,特别是强调了无序区域在调控基因组可及性(genomic accessibility)中的重要作用。
动态基因组调控:分钟级分辨率的活细胞洞察
零距离光交联技术的最大优势之一是能够定量分析在不同细胞处理条件下的蛋白质-DNA相互作用组,从而揭示基因组调控的动态变化,包括转录因子(transcription factors)的招募、DNA修复(DNA repair)的响应,甚至是快速变化的染色质可及性。
雌激素诱导的转录因子招募
研究团队首先将血清饥饿(serum-starved)的MCF7细胞暴露于高剂量雌激素(10纳摩尔,nM 17β-雌二醇)中45分钟,然后定量比较处理前后的DNA互作蛋白质组。结果显示:
ESR1的显著招募: 雌激素受体α(ESR1)与DNA的结合量惊人地增加了30倍,成为变化最显著的蛋白质,其调整后的p值(adj. p)达到2.6E-42。这表明雌激素迅速触发了ESR1从细胞质向细胞核的转运,并使其在DNA上大量富集,从而启动了下游基因的转录程序。
协同作用者(coactivators)的招募: 已知的ESR1相互作用者,如RNA聚合酶II(POLR2A)和SMARCA4,以及其他转录协同作用者(transcriptional coactivator complexes),如BPTF、CHD1和CHD6,也显示出与DNA结合量的显著增加。
抑制因子(repressors)的解离:另一方面,转录抑制因子SET、CBX3和CBX5与DNA的结合量则显著减少,这可能为血清饥饿细胞中染色质的去浓缩(decondensation)做好了准备。
剂量响应(dose-response)曲线:研究团队进一步测试了11种不同浓度的雌激素(从10纳摩尔到30飞摩尔,fM),发现ESR1与DNA结合的半有效浓度(EC50)低至35皮摩尔(pM),这与体外放射配体结合测定(radioligand assay)报道的50皮摩尔(pM)的Kd值非常接近,显示了该方法的灵敏度。
核苷酸交联肽的验证: 在雌激素处理的样本中,研究团队共鉴定出346个4ST交联肽,对应255种蛋白质,进一步验证了在蛋白质水平观察到的雌激素诱导变化。
这项技术不仅能捕捉到转录因子在细胞扰动(cellular perturbations)下响应性招募的动态,甚至能用于计算这些因子与DNA结合的剂量响应曲线,这对于药物筛选和机制研究具有重要意义。
基因毒性药物:DNA损伤与修复的分子面貌
研究团队还评估了三种临床常用化疗药物——依托泊苷(etoposide)、顺铂(cisplatin)和奥沙利铂(oxaliplatin)——对DNA互作蛋白质的影响。这些药物通过不同机制损伤DNA,从而抑制快速分裂细胞的生长。
共同响应:所有药物处理都导致细胞周期调控因子CDKN1A(也称p21),以及DNA修复蛋白质TP53BP1、SIRT7和HINT1显著增加与DNA的结合。这表明这些药物均能激活广泛的细胞应激(cellular stress)和DNA损伤响应。
NHP2的显著减少:在所有药物处理中,端粒酶复合体(telomerase complex)的组分NHP2与DNA的结合量出现最显著的减少,在未处理细胞中才能检测到NHP2与DNA的结合。这表明基因毒性药物处理可能导致端粒酶活性下降,促进损伤诱导的细胞衰老(senescence)。
药物特异性响应:
顺铂(Cisplatin): 在顺铂处理下,DNA损伤应答关键激酶ATM和CHEK2被强烈招募到DNA上。此外,非同源末端连接(NHEJ)标记物XRCC4和ATM激活磷酸酶PPP5C与DNA的结合量也显著增加。研究团队还发现,核酸内切酶(exonuclease)REXO4和FEN1在顺铂处理下显著富集在DNA上。敲低FEN1和PPP5C能够显著增加细胞凋亡(apoptosis),这表明它们可能是潜在的联合治疗靶点。
依托泊苷(Etoposide): CHEK2在依托泊苷处理后被招募到DNA上。拓扑异构酶(topoisomerases)TOP2A和TOP2B的积累量显著增加,这与药物的拓扑异构酶抑制机制一致。
奥沙利铂(Oxaliplatin): 与其他药物不同,奥沙利铂处理后,研究团队观察到核仁蛋白质(nucleolar proteins)特别是核仁前核糖体(NOP56p)复合物的DNA结合量显著减少。这与奥沙利铂诱导核糖体生物合成(ribosome biogenesis)应激和核仁解体(nucleolar disintegration)的报道一致。
过氧化物还原酶的积累: 令人意外的是,过氧化物还原酶(peroxiredoxins)PRDX1和PRDX2在顺铂处理后大量积累在DNA上,其总量在增加的蛋白质中占比超过10%。这提示了氧化应激(oxidative stress)在顺铂作用中的重要性,以及这些酶可能在DNA损伤应答中的作用。
这项研究首次通过定量DNA互作蛋白质组学(proteomics)的视角,揭示了不同基因毒性药物作用下蛋白质与DNA相互作用的特异性变化,为理解药物作用机制和发现潜在的联合治疗靶点提供了宝贵信息。
染色质可及性的快速调控:BAF抑制的分钟级洞察
染色质可及性由核小体(nucleosome)的拓扑结构决定,并深刻影响着染色质结合蛋白(chromatin-binding proteins)和核糖核酸的结合。哺乳动物的基因组(genome)由四种核小体重塑复合物(nucleosome-remodeler families)组织。对BAF(BRG1/BRM-associated factor)染色质重塑复合物的抑制,能在数分钟内导致DNA可及性的快速且广泛的限制,但其背后的机制尚不完全清楚。
研究团队利用零距离光交联技术的分钟级分辨率优势,对MCF7细胞进行BAF抑制剂BRM014处理20分钟的时间序列分析,并与匹配的核蛋白质组和总蛋白质组以及甲醛交联染色质进行比较。
超快速响应:尽管BRG1/BRM(SMARCA4/SMARCA2编码)的丰度保持不变,但在短短4分钟内,研究团队就观察到HMGB1、ANP32A和ANP32E等多种蛋白质与DNA的相互作用显著增强。HMGB蛋白质已知能促进DNA可及性,其快速招募可能是在BAF抑制后对DNA可及性的补偿。而ANP32A是INHAT复合体(抑制乙酰转移酶)的组成部分,ANP32E则是一种组蛋白伴侣(histone chaperone),已知能限制启动子和增强子区域的DNA可及性。这些蛋白质的协同作用可能有助于染色质可及性的进行性限制,并拮抗BAF活性。
独特的优势: 这些分钟级别的快速动态变化,在传统甲醛交联染色质(需要10分钟固定时间)或总蛋白质组学分析中都未能观察到。这凸显了零距离光交联技术在捕捉瞬时、快速相互作用变化方面的独特优势,为我们理解染色质动态(chromatin dynamics)提供了全新的视角。
核苷酸交联肽的动态:核苷酸交联肽的数据进一步支持了这些蛋白质水平的动态变化。例如,HMGB1的DNA结合结构域(DNA-binding domains)上的肽-DNA杂合体(peptide-DNA hybrids)的检测频率随时间增加。
这项研究首次在活细胞中以分钟级时间分辨率,揭示了染色质可及性在受到BAF抑制时蛋白质-DNA相互作用的快速动态变化,为理解基因组重塑(genome remodeling)的分子机制提供了宝贵线索。
开启基因组学研究的新纪元
这项零距离光交联技术的开发,无疑为蛋白质-DNA相互作用的研究带来了革命性的突破。它能够以前所未有的深度和广度,揭示活细胞中蛋白质与DNA的直接物理接触,为基因组学(genomics)研究开辟了新的途径。
这项技术超越了传统的假设驱动型研究模式。通过对整个DNA互作蛋白质组的全面、定量分析,研究人员可以无偏见地识别新的DNA结合蛋白、DNA修复因子,以及参与染色质组织和基因表达调控的蛋白质。这有助于发现此前未知的基因组调控机制和蛋白质功能。
这项技术不仅适用于人类细胞,也适用于其他生物体和组织。它有望在多个领域带来深远影响:
基因组调控的深入理解:揭示转录因子、染色质重塑复合物和核苷酸代谢酶等如何精确调控基因表达,对于理解细胞分化(cell differentiation)、发育(development)和疾病发生至关重要。
药物发现与机制研究:通过比较药物处理前后的DNA互作蛋白质组,可以识别药物靶点、解析药物作用机制,并发现潜在的联合治疗策略,为癌症和其他疾病的治疗提供新思路。
疾病的分子基础:许多疾病,特别是癌症,与DNA损伤修复缺陷和基因组不稳定密切相关。这项技术有望揭示这些疾病中蛋白质-DNA相互作用的异常,为精准医疗(precision medicine)提供生物标志物(biomarkers)和治疗靶点。
相分离生物学(phase separation biology)的探索:意外发现RRM结构域在DNA互作蛋白质中的富集,提示了相分离在基因组功能中的潜在作用,为该新兴领域的研究提供了新工具。
尽管这项技术取得了显著的成就,但研究团队也坦诚地指出了其当前的一些局限性,并展望了未来的改进方向:
细胞增殖依赖性:该方法依赖于细胞增殖以将4ST掺入DNA,因此不适用于非分裂细胞或原代(primary)细胞的某些研究场景。未来的工作可以探索无需增殖的标记方法,例如瞬时转染(transient transfection)或病毒介导的4ST递送。
转录因子捕获的偏倚:并非所有转录因子都能被有效捕获,特别是那些不含胸苷(thymidine)基序(motif)的转录因子。通过结合使用6-硫代鸟苷(6-thioguanosine)等替代光敏剂(photo-sensitizer),可以弥补这一不足。
高丰度蛋白质的偏倚: 研究发现,高丰度蛋白质更容易被检测到交联肽。未来可以通过改进质谱技术(mass spectrometry)和数据分析方法,提高对低丰度蛋白质的检测灵敏度。
特异性验证:对于在非已知DNA结合结构域或IDR中发现的DNA交联位点,仍需进一步的实验(如凝胶阻滞实验,gel shift assays)来确认其DNA锚定功能。
该研究通过开发“零距离光交联”这一创新技术,为我们提供了前所未有的窗口,以前所未有的速度和分辨率揭示了活细胞中蛋白质与DNA的直接相互作用。它不仅绘制了详细的人类DNA互作蛋白质图谱,还揭示了这些相互作用的动态变化以及无序区域的关键角色。这项突破性工作为我们理解基因组调控、药物作用机制以及疾病的分子基础开辟了新途径,预示着基因组学研究即将进入一个更加精细、更加动态的时代。
参考文献
Trendel J, Trendel S, Sha S, Greulich F, Goll S, Wudy SI, Kleigrewe K, Kubicek S, Uhlenhaut NH, Kuster B. The human proteome with direct physical access to DNA. Cell. 2025 May 14:S0092-8674(25)00507-0. doi: 10.1016/j.cell.2025.04.037. Epub ahead of print. PMID: 40409270.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
往期热文:
Nature Genetics
| 告别“批量”模糊:首个大规模单细胞研究,解码胶质母细胞瘤纵向演变的“个体差异”与“普遍规律”Nature
| 为什么你能快速上手新事物?原来是纹状体pDMSt帮你搞定了“逐次试验更新”N Engl J Med
| “坏胆固醇”克星再升级?新药Obicetrapib狂降近30%,心脏救星来了?Nature
| “误会”致癌基因?研究揭示髓母细胞瘤起源新图景:CNVs才是幕后“启动者”!The Lancet
| 肝癌一线治疗大洗牌!CheckMate 9DW:双免疫组合显著延长晚期肝癌患者生命,生存率创纪录Nature | 耐药癌细胞的末日铁骑!揭秘溶酶体铁引发的死亡风暴
来源:生物探索一点号1