摘要:我们身体里形态和功能千差万别的细胞,从思考的大脑神经元到跳动的心脏肌肉细胞,都携带着同一套DNA密码本?如果基因组序列是生命的蓝图,那究竟是什么力量决定了每个细胞会“阅读”和执行蓝图中的哪些部分,最终构建出如此多姿多彩的生命?答案不仅藏在DNA的线性序列里,更
我们身体里形态和功能千差万别的细胞,从思考的大脑神经元到跳动的心脏肌肉细胞,都携带着同一套DNA密码本?如果基因组序列是生命的蓝图,那究竟是什么力量决定了每个细胞会“阅读”和执行蓝图中的哪些部分,最终构建出如此多姿多彩的生命?答案不仅藏在DNA的线性序列里,更在于它在细胞核内的“三维空间建筑”!
基因组DNA并非随意地挤压在一起,而是精巧地折叠、缠绕,形成复杂的染色质(chromatin)结构。这种三维构象如同一个精密的分子机器,能将基因组中相隔遥远的“开关”——顺式调控元件(cis-regulatory elements),比如增强子(enhancer),与控制基因表达的“启动器”——启动子(promoter)拉近到一起,实现精准的基因调控。正是这种神奇的“空间互动”,决定了细胞独特的身份和功能。
动物界的出现,标志着生命演化史上一个巨大的飞跃,从简单个体迈向具有高度分化细胞的复杂多细胞生物。这个复杂性的起源,除了新基因的涌现,是否更依赖于基因调控体系的根本性革新?特别是,基因组这种高级的三维组织形式,例如形成远端调控区域和启动子之间连接的染色质环化(chromatin looping),是在何时、如何出现的?
5月7日发表在《Nature》上的研究“Chromatin loops are an ancestral hallmark of the animal regulatory genome”,正是一次追溯生命分子建筑历史的壮举。研究人员以前所未有的分辨率,绘制了包括早期动物(如海绵、栉水母)及其单细胞远亲的基因组三维图谱。他们惊人地发现,某个关键的基因组组织特征,在动物演化的黎明时期就已出现,成为区分动物与单细胞生命的“祖先标志”(ancestral hallmark),为复杂生命的兴起奠定了基石。
跨越演化鸿沟:追踪染色质组织的足迹
为了描绘出动物基因组三维组织的演化图谱,研究团队采取了“跨物种”的策略,选择了涵盖演化关键节点的物种进行比较分析。他们不仅研究了我们熟悉的两侧对称动物(bilaterian animals),如人类(Homo sapiens)和果蝇(Drosophila melanogaster),更将目光投向了早期分化的非两侧对称动物(non-bilaterian animals)——包括海绵(sponges)、栉水母(ctenophores)、扁盘动物(placozoans)和刺胞动物(cnidarians)。更重要的是,他们还研究了动物最亲近的单细胞亲属(unicellular relatives),即动物总界(holozoans)中的鱼孢动物(ichthyosporeans)、丝足虫(filastereans)和领鞭毛虫(choanoflagellates)。
这项研究的核心技术是高分辨率的染色质构象捕获(Micro-C),这项技术能够以接近单个核小体(nucleosome)的精度来绘制全基因组范围内的染色质相互作用图谱。为了更全面地理解这些三维结构背后的调控机制,研究团队还结合了表观基因组学(epigenomics)数据,包括染色质开放性(ATAC-seq)、组蛋白修饰(histone modifications,如H3K4me1、H3K4me2、H3K4me3)以及基因表达(RNA-seq)数据。对于部分关键物种,他们甚至进行了染色质结合蛋白组学(chromatin-bound proteomics)和DNA亲和纯化测序(DAP-seq)分析,试图找到那些可能介导三维结构的“建筑师”蛋白。
值得一提的是,为了获得高质量的数据,研究团队甚至对栉水母(Mnemiopsis leidyi)、海绵(Ephydatia muelleri)和丝足虫(Capsaspora owczarzaki)的基因组进行了从头测序和染色体水平的组装(de novo sequencing and chromosome-scale assembly),并对其他物种的现有基因组进行了重组(re-scaffolding),为后续的精细分析打下了坚实的基础。
区室化:古老却非普遍的隔间法则
首先,研究团队分析了基因组的大尺度组织特征——染色质区室化(chromatin compartmentalization)。基因组会被划分为转录活跃、基因密度高的A区室(active A compartment)和转录不活跃、转座子富集的B区室(inactive B compartment)。这种区室化被认为是染色质的一种固有的生物物理特性,与相分离(phase separation)有关,它将基因组有效地分隔成功能上不同的区域。
通过计算不同物种A/B区室相互作用的强度(同源性相互作用AA, BB与异源性相互作用AB, BA的比值),研究发现,除了栉水母(M. leidyi)之外,所有动物物种的基因组都表现出明显的A/B区室分离。例如,人类基因组的区室强度值高于1.8,这表明A区室内部和B区室内部的相互作用远高于A区室和B区室之间的相互作用。而在单细胞全动生物(S. arctica, C. owczarzaki, S. rosetta)中,这种大尺度区室化则不明显,与酵母等单细胞生物类似。
这一发现表明,大尺度染色质区室化在动物演化中是相对保守的特征,它可能在动物出现之前就已经存在于单细胞生物祖先中。然而,栉水母(M. leidyi)的特殊情况(区室化不明显)也提示我们,即使在动物界内部,这种大尺度区室化的模式也可能存在多样性,并且可能与是否存在组成型沉默区域(constitutively silenced regions)有关。这表明,尽管区室化是一个古老的特征,但它在不同谱系中的具体表现和调控机制可能有所不同。
绝缘边界:基因邻域的守护者
接下来,研究人员分析了基因组中规模较小的结构——绝缘边界(insulation boundaries)。这些边界将基因组划分成独立的结构域(domains),可以防止邻近区域的基因调控互相干扰。绝缘边界的形成可能与活跃的转录、重复序列的沉默,或者特定的“建筑师”蛋白结合有关。
研究团队为每个物种计算了绝缘分数(insulation score),用以量化基因组区域的隔离程度。他们发现,单细胞生物(C. owczarzaki, S. rosetta)和海绵(E. muelleri)的基因组绝缘性相对较弱。例如,绝缘边界之间的中位距离差异很大,从领鞭毛虫(S. rosetta)的6.4千碱基(kb)到人类(H. sapiens)的190千碱基(kb)不等。但在绝缘边界内包含的基因数量,各物种之间则相对一致,中位数为2-4个基因。
对绝缘边界关联的基因组特征进行分析发现,在单细胞生物和海绵(E. muelleri)中,大多数绝缘边界与活跃的转录起始位点(TSS)相关联。这提示在这些物种中,活跃的转录可能是形成绝缘的主要因素。而在栉水母(M. leidyi)、扁盘动物(T. adhaerens)和两侧对称动物(D. melanogaster, H. sapiens)中,许多绝缘边界与染色质环(chromatin loop)的锚点(anchor)相关联。例如,在栉水母(M. leidyi)中,77%的绝缘边界是染色质环的锚点;在扁盘动物(T. adhaerens)中,这一比例是38%。这表明,在早期分化的动物谱系中,染色质环已经成为定义基因组结构域边界的重要特征。
这项结果进一步细化了我们对基因组组织演化的认识。虽然转录介导的绝缘可能是一个古老的机制,但与特定序列和“建筑师”蛋白结合相关的、更强的绝缘边界和结构域,似乎在动物演化后期,特别是在两侧对称动物中变得更加突出和多样化。
染色质环化的黎明:动物调控基因组的祖先标志
染色质环(chromatin loops)是将基因组中远距离的区域(通常是增强子和启动子)在空间上拉近的关键结构,是实现精细、组合式基因调控的重要机制。
研究团队在栉水母(M. leidyi)、扁盘动物(T. adhaerens)和刺胞动物(N. vectensis)的基因组中检测到了大量的染色质环。例如,在栉水母(M. leidyi)中,他们识别出了惊人的4,261个染色质环;在扁盘动物(T. adhaerens)中,有3,065个;而在刺胞动物(N. vectensis)中,虽然数量相对较少,也有166个。将这些数量与果蝇(D. melanogaster)的313个染色质环相比,可以发现栉水母和扁盘动物的基因组大小与果蝇相似甚至更小(栉水母基因组约208Mb,扁盘动物约90Mb,果蝇约137Mb,人类约3099Mb),但它们拥有的染色质环数量却远超果蝇。这表明,在早期分化的动物中,染色质环已经是普遍存在的特征。
有趣的是,这些染色质环连接的区域类型在不同物种中有所不同。在栉水母(M. leidyi)中,大多数染色质环(77%)连接的是启动子和增强子(promoter-enhancer loops),这与人类(63%是P-E或P-U)和刺胞动物(N. vectensis)(69%是P-E)类似。而在扁盘动物(T. adhaerens)中,绝大多数染色质环(79%)连接的是启动子与启动子(promoter-promoter loops),这与果蝇(49%是P-P)的模式更为相似。这种启动子-启动子环化可能在将多个管家基因(housekeeping genes)或同一调控网络下的基因拉近空间距离、实现协同表达中发挥作用,正如在小鼠胚胎干细胞中观察到的管家基因簇(cluster)一样。
染色质环的大小在这些早期分化的动物中也具有可比性,中位大小约为21-28千碱基(kb),尽管远小于人类基因组中中位大小为140千碱基(kb)的染色质环。
关键的发现是,在所有研究的单细胞生物(S. arctica, C. owczarzaki, S. rosetta)中,研究团队都没有观察到明显的染色质环结构。虽然他们检测到了一些远距离接触,但这些接触呈现为弥散的、区域性的信号增强,而不是典型的染色质环所表现出的局部的、点状的高频接触。例如,在鱼孢动物(S. arctica)中,他们识别了296个自相互作用的绝缘结构域,这些区域富集转座子并缺乏活跃的组蛋白修饰,可能代表了共同隔离的沉默区域。在丝足虫(C. owczarzaki)中,他们观察到了一种特殊的“格子状”(plaid pattern)接触模式,这反映了活跃启动子区域的微区室化(microcompartmentalization),与高转录基因的启动子有关联。然而,这些都不是典型的、由远端调控元件与启动子形成的染色质环。
这一核心对比——单细胞亲属中没有染色质环,而早期分化的动物中普遍存在——有力地证明了染色质环化这项关键的基因组组织特征,是在动物演化伊始出现的创新,是动物调控基因组的“祖先标志”(ancestral hallmark)。
驱动环化的分子机制:意想不到的演化路径
既然染色质环化在动物起源时就已出现,那么,驱动这些环化形成的分子机制是什么呢?在两侧对称动物中,CTCF蛋白是介导染色质环化和绝缘结构域形成的主要“建筑师”蛋白之一。然而,CTCF蛋白在非两侧对称动物中是缺失的。这项研究深入探索了早期动物中染色质环形成相关的潜在机制。
在扁盘动物中,研究团队发现染色质环的锚点区域富集了一个特定的序列基序(sequence motif),并且这个基序与Mutator DNA转座子(Mutator DNA transposons)的末端倒置重复序列(TIR)相似。对扁盘动物基因组中Mutator TIR序列的系统分析揭示了一个跨物种保守的Mutator家族。他们发现,大约三分之一的扁盘动物基因(包括T. adhaerens和C. collaboinventa)的启动子区域频繁包含Mutator转座子插入,特别是那些形成启动子枢纽(promoter hubs)、参与染色质环化的基因。例如,在T. adhaerens中,321个启动子枢纽区域包含1,695个基因;在C. collaboinventa中,331个枢纽包含2,191个基因,每个枢纽中位数包含4-5个启动子。这些枢纽区域的基因通常是高表达的管家基因。Mutator转座子与染色质环的关联提出了两种可能性:一是存在某种扁盘动物特有的“建筑师”蛋白,识别并结合Mutator TIR序列,将这些位点“驯化”(domestication)为调控元件的连接点;二是Mutator转座子倾向于插入到高表达基因的启动子区域,无意中促进了这些区域的相互作用。无论哪种情况,都表明转座子在塑造早期动物基因组三维结构中可能扮演了意想不到的角色。
在栉水母(M. leidyi)中,研究团队发现染色质环锚点区域(无论是在启动子还是增强子区域)富集了一个GC富集基序(GC-rich motif),这个基序存在于超过75%的环锚点中。通过长读长测序(Nanopore sequencing)分析DNA甲基化(DNA methylation),他们发现这个GC富集基序在环锚点区域表现出较低的甲基化水平,而在环外区域则甲基化水平较高。这提示DNA甲基化可能通过影响某种未知“建筑师”蛋白的结合来调控栉水母的染色质环形成,这类似于脊椎动物中CTCF蛋白的功能,CTCF的结合也受到DNA甲基化的影响。通过染色质结合蛋白组学和DAP-seq分析,他们识别出了两种栉水母特有的zf-C2H2结构蛋白(CTEP1和CTEP2),这两种蛋白与这个GC富集基序结合,且结合能力受到DNA甲基化的抑制。这项发现揭示了一种在栉水母中独有的、依赖特定蛋白和可能受甲基化调控的染色质环化机制。
在刺胞动物(N. vectensis)中,研究发现染色质环锚点富集了YY1蛋白(YY1 protein)的结合基序。YY1在脊椎动物中已知是一种参与染色质环化的结构蛋白。这可能代表了跨动物谱系保守的环化驱动蛋白,但也可能是趋同演化的结果,需要更多物种的数据来确认。
总的来说,这些发现揭示了驱动染色质环化的分子机制在早期动物中是多样化的,扁盘动物可能利用了转座子,栉水母发展出了特有的蛋白和甲基化调控,而刺胞动物可能使用了YY1等蛋白。这种多样的分子基础可能反映了早期动物在演化过程中独立探索构建基因组三维结构的路径。
演化新篇章:从简单到复杂的跳跃
综合所有发现,这项研究描绘了一幅关于动物调控基因组演化的新图景:
在单细胞生物祖先中,基因组的三维结构可能主要由聚合物物理特性(polymer physics)和转录状态驱动,形成了基于转录状态的区室化,但缺乏特定序列决定的绝缘结构域和稳定的染色质环。
在动物起源时(动物最后共同祖先 Metazoa LCA),出现了一项关键的创新:序列决定的染色质环化。这种机制能够稳定地将远端的顺式调控元件(如新演化出的增强子样序列)与基因启动子连接起来。这项创新为基因调控增加了新的维度,使得基因能够以前所未有的复杂方式进行组合调控,从而促进了动物细胞类型多样性的出现和分化。
在两侧对称动物起源时(两侧对称动物最后共同祖先 Bilateria LCA),基因组结构进一步演化,出现了由特定序列决定的强绝缘结构域,以及像CTCF这样的核心绝缘子蛋白介导的环挤压(loop extrusion)机制,使得基因组组织更加精细和稳定。
这项研究的发现填补了我们理解基因组三维结构演化历史的关键空白。染色质环化不再被认为是两侧对称动物独有的特征,而是早在动物多细胞性出现伊始就已经演化出的核心机制。这项创新性的基因组组织方式,为更精细、更复杂的基因调控铺平了道路,是动物生命得以构建出丰富多样的细胞类型和组织器官的分子基石。
当然,这项研究也提出了一些新的问题:驱动早期动物染色质环化的 lineage-specific factors(谱系特异性因子)还有哪些?这些染色质环在动物发育过程中以及不同细胞类型中是否具有动态性?这些环化机制是否与单细胞亲属中观察到的微区室化存在演化联系?未来的研究将需要更多跨物种、跨发育阶段的基因组三维结构研究,并结合更深入的分子机制解析,来进一步完善这幅壮丽的动物基因组演化图谱。
参考文献
Kim IV, Navarrete C, Grau-Bové X, Iglesias M, Elek A, Zolotarov G, Bykov NS, Montgomery SA, Ksiezopolska E, Cañas-Armenteros D, Soto-Angel JJ, Leys SP, Burkhardt P, Suga H, de Mendoza A, Marti-Renom MA, Sebé-Pedrós A. Chromatin loops are an ancestral hallmark of the animal regulatory genome. Nature. 2025 May 7. doi: 10.1038/s41586-025-08960-w. Epub ahead of print. PMID: 40335694.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
往期热文:
Nature | 从NGG到任意PAM:揭秘AI驱动的Cas9变体设计
Cell | 意想不到!细胞力学成细菌“同伙”?揭秘牵引力如何引导入侵热点
Nature
| 脑海里的“寒风”真的会冷!新研究揭示:大脑如何通过情境记忆调控全身代谢Nature Medicine
| 刷新认知!体内巨细胞病毒,竟是抗癌“隐形队友”?揭秘CMV与免疫疗法生存奇迹!Science | cycleHCR技术实现深层组织RNA与蛋白质同步高分辨成像
Nature Methods
| 质谱分析终结者?CHIMERYS统一DDA、DIA、PRM数据,破译蛋白质密码来源:生物探索一点号1