摘要:从精卵结合那一刻起,一个微小的单细胞合子(zygote),是如何被赋予了创造万物的无限潜能,又如何在最初的几天内,一步步精准地搭建起复杂生命的蓝图,最终孕育出我们自身?
引言
从精卵结合那一刻起,一个微小的单细胞合子(zygote),是如何被赋予了创造万物的无限潜能,又如何在最初的几天内,一步步精准地搭建起复杂生命的蓝图,最终孕育出我们自身?
这绝非简单的遗传物质复制,而是一场远超想象的“编程盛宴”。研究人员发现,除了DNA本身,还有一套更为隐秘却至关重要的“指令系统”——表观基因组(epigenome),在生命最早期扮演着“总指挥”的角色。它决定着基因何时沉默、何时激活,细胞何时分化、何时保持未分化状态。
想象一下,一个拥有“全能性”(totipotency)的合子,如何在短短几天内,“蜕变”为具备“多能性”(pluripotency)的囊胚,完成生命史上第一次关键的细胞命运抉择。这背后,是细胞核内发生的一系列惊心动魄的变革:基因组被大规模地“重塑”,转录活动如同交响乐般逐渐奏响,组蛋白(histone)被精妙地修饰(post-translational modifications, PTMs),染色质结构(chromatin architecture)被重新排布,甚至DNA的复制节律(replication timing)也在重新定义。
长期以来,由于早期胚胎材料的极度稀少,这些微观的生命奇迹,如同被蒙上了一层神秘的面纱。然而,近年来,低样本量基因组学(low-input genomics)技术的革命性突破,如ATAC-seq、CUT&RUN和单细胞Hi-C等,犹如探照灯般穿透了重重迷雾,让研究人员得以以前所未有的分辨率,窥探生命最初的“编程密码”。
正是基于这些激动人心的前沿进展,近期《Nature Reviews Genetics》发表的一篇权威综述,为我们系统揭示了早期哺乳动物胚胎中表观基因组的惊人动态。这不仅仅是一份科学报告,更是一部关于生命起源的微观史诗,一场决定我们之所以成为我们的“华丽舞蹈”。
生命序章的奥秘:从“全能”到“多能”的华丽转身
生命的起始,远比我们想象的更为复杂和精妙。受精卵,作为最初的生命形式,拥有无与伦比的“全能性”——这意味着它能分化成构成完整生物体所需的所有细胞类型,包括胚胎本身和胚胎外的支持组织。然而,随着胚胎的早期发育,在植入前囊胚期(pre-implantation blastocyst stage),这种全能性会逐渐转变为“多能性”,并伴随着第一次细胞命运决定,形成内细胞团(inner cell mass)和滋养外胚层(trophectoderm)。
这背后,细胞潜能(cellular potency)的巨大转变,绝非随机事件,而是由核内发生的一系列大规模重塑所驱动。想象一下,核内犹如一个繁忙的中央控制室,正在进行着包括大规模转录(transcriptional)、表观遗传(epigenetic)和染色质结构(architectural)的改造,以及DNA复制程序(DNA replication programme)的重新建立。正是这些精密的重编程,确保了胚胎的正常发育和细胞命运的正确导向。
长期以来,对这些早期胚胎进行深入的分子研究面临着巨大挑战,因为可用的细胞材料极其有限。然而,得益于近年来低样本量基因组学(low-input genomics)技术的突破,例如:
ATAC-seq(Assay for Transposase-Accessible Chromatin with sequencing):用于绘制染色质可及性(chromatin accessibility)图谱。
ULI-MNase-seq(Ultra-low-input micrococcal nuclease digestion-based sequencing):用于精确定位核小体(nucleosome positioning)。
CUT&RUN(Cleavage Under Targets and Release Using Nuclease)和 CUT&Tag(Cleavage Under Targets and Tagmentation):用于精确绘制组蛋白翻译后修饰(histone post-translational modifications, PTMs)和转录因子结合位点。
Low-input Hi-C(Low-input High-resolution Chromosome Conformation Capture coupled to High-throughput Sequencing)和 Single-cell Hi-C:用于解析染色质三维空间组织。
scRepli-seq(Single-cell replication timing sequencing):用于绘制DNA复制时间图谱。
这些技术使得我们能够以前所未有的分子细节,在体内(in vivo)研究这些关键过程,极大地加深了对植入前胚胎表观基因组重编程和染色质动态的理解。
基因组的“唤醒”之旅:合子基因组激活(ZGA)的惊人发现
从母源控制到胚胎自身基因组掌控的转变,即“母源到合子转换”(MZT),是早期胚胎发育的关键事件。这一过程不仅涉及母源RNA和蛋白质的降解,更重要的是“合子基因组激活”(ZGA)的启动。ZGA标志着胚胎自身生命程序的真正开始。
ZGA的“双重奏”:微弱启动与强劲爆发
在小鼠中,ZGA的发生呈现出明显的“双重奏”:
微弱ZGA(minor ZGA):这一波激活在受精卵(合子)的第一次细胞分裂S期就已启动,其特点是基因组间区域(intergenic regions)的普遍转录和RNA聚合酶II(Pol II)的广泛结合。研究表明,微弱ZGA的转录可能在不精确的转录起始位点(transcription start sites, TSSs)启动,且通常未经剪接(unspliced)。尽管具体转录基因数量难以精确测定,但可逆性抑制微弱ZGA会导致发育停滞,无法启动主要ZGA,这表明微弱ZGA对胚胎发育至关重要。
主要ZGA(major ZGA):在小鼠中,主要ZGA在2细胞期的S期启动,涉及数千个基因的激活,其中许多基因仅在此阶段表达。如果使用Pol II抑制剂阻止主要ZGA,胚胎会停滞在2细胞期,因此主要ZGA对发育不可或缺。与微弱ZGA相比,主要ZGA的转录控制更为“规范”,具有典型的启动子近端TSSs、剪接和典型的延伸因子调节。然而,新兴的低样本量RNA测序技术显示,许多“主要ZGA基因”的转录比以往认为的要早,这可能得益于更高的灵敏度。
人类与小鼠ZGA的差异化路径
有趣的是,不同哺乳动物物种的ZGA进程存在差异。在人类胚胎中,主要ZGA发生在4到8细胞期,但早在合子阶段就已检测到转录活性,并产生了正确剪接的转录本。这提示我们,在剪接调节方面,微弱和主要基因组激活之间的区别可能在小鼠和人类之间并不完全保守。
转座元件(Transposable Elements, TEs)的“狂欢”
植入前胚胎发育的一个显著特征是转座元件(TEs)家族的广泛转录。在小鼠、人类和猪胚胎中,最活跃的转座元件属于长末端重复序列(Long Terminal Repeat, LTR)家族的内源性逆转录病毒(endogenous retroviruses)。这些LTRs通常作为替代启动子和第一个外显子,导致产生新的蛋白质异构体。例如,小鼠内源性逆转录病毒MERV-L的MT2_Mm LTR,在2细胞期高度特异性表达,作为2细胞期转录组的很大一部分启动子,对胚胎植入前发育至关重要。此外,ZGA还涉及大量非编码RNA的转录,它们在调节基因表达中扮演着重要角色,例如U7小核仁RNA,它能通过染色质压缩调节ZGA。
RNA修饰的“秘密武器”
除了DNA和组蛋白修饰,RNA分子本身的化学修饰也构成了另一层重要的表观遗传调控。目前已发现超过100种RNA修饰,它们能够影响RNA的稳定性、加工、二级结构、相互作用和定位。其中,N6-甲基腺苷(N6-methyladenosine, m6A)是研究最广泛的一种。m6A修饰在小鼠卵母细胞和胚胎中广泛存在,并富集在合子基因组激活特异性基因和转座元件的转录本上,对其及时降解至关重要。研究发现,m6A修饰的耗尽或抑制会导致早期胚胎致死,这表明RNA修饰在调控染色质和DNA修饰方面提供了额外的调节层面,对发育至关重要。
精卵邂逅的“化学交响乐”:受精后的表观遗传重编程
精子和卵母细胞在受精时,分别携带了独特的染色质配置。受精后,这两个亲本基因组在合子中融合,但最初它们在物理上是分离的,并经历了显著的重编程。
父源基因组的“旧貌换新颜”:组蛋白与核小体的重构
精子基因组的特点是组蛋白(histones)被普遍替换为鱼精蛋白(protamines),以实现高度紧密包装。然而,研究表明,哺乳动物精子中仍有约2%到15%的组蛋白被保留下来。受精后,核小体(nucleosome)会在父源基因组上重新组装,其中HIRA介导的H3.3组蛋白掺入对从头核小体组装至关重要。此外,DAXX依赖的H3.3掺入到父源着丝粒周围异染色质(pericentric heterochromatin)中,对染色体稳定性也必不可少。
H3.3在合子中呈现非经典、基因组范围内的均匀分布,这可能是因为它在这一阶段是主要的H3形式。有趣的是,H3.3向更规范分布模式的重分布(例如在TSSs富集)发生在ZGA时,并且依赖于DNA复制,但独立于转录。而负责掺入H3.1和H3.2变体的复制依赖性伴侣CAF1(Chaf1编码)的下调,会导致小鼠胚胎干细胞表现出2细胞样表型,并部分重现合子和2细胞期胚胎特有的“模糊”(fuzzy)核小体定位。小鼠胚胎若缺乏CAF1活性,则无法发育超过桑葚胚期,并表现出转座元件上调,这凸显了CAF1在促进胚胎早期阶段抑制性组蛋白PTMs沉积中的潜在作用。
在组蛋白修饰方面,父源基因组在受精后被广泛超乙酰化(hyperacetylated)和低甲基化(hypomethylated),这建立起了亲本前核(pronuclei)之间的表观遗传不对称性。
母源基因组的“奇妙遗产”:组蛋白PTMs的独特景观
卵母细胞基因组含有核小体,但其组蛋白变体、PTMs和DNA甲基化的分布模式异于寻常。
DNA甲基化:卵母细胞含有大片(10-50kbp)的DNA高度甲基化、低甲基化或部分甲基化区域。在小鼠卵母细胞中,高度甲基化区域与活跃转录区域相关。而在猪和牛卵母细胞中,高度甲基化区域也存在于非转录区域。低甲基化和部分甲基化区域则位于基因间区(intergenic regions),但也存在于非转录基因体和启动子中,包括与ZGA相关的基因,并被H3K4me3宽域所占据。
非经典H3K4me3宽域(ncH3K4me3 broad domains):在小鼠卵母细胞中,这些宽域覆盖了约20%的基因组,由KMT2B在卵母细胞生长过程中建立。它们的出现与卵母细胞基因组转录沉默的时间相吻合。有趣的是,通过表达去甲基化酶KDM5A移除小鼠卵母细胞中的H3K4me3,会导致全局转录激活,这表明H3K4me3可能与小鼠生殖系中的转录沉默有关。在猪和牛卵母细胞中也检测到ncH3K4me3宽域,它们与低水平DNA甲基化区域相关。但人类卵母细胞仅含经典的H3K4me3,主要富集在启动子。
非经典H3K27乙酰化(ncH3K27ac)宽域:在小鼠和牛卵母细胞中也检测到,但人类卵母细胞中没有。然而,人类胚胎除了经典的H3K4me3在启动子富集外,ZGA之前还存在宽泛的ncH3K4me3和ncH3K27ac远端调控区域。这表明,虽然非经典组蛋白PTMs宽域并非在所有哺乳动物物种的同一阶段发生,但它们是受精前后哺乳动物表观遗传重编程的共同特征。
H3K27me3和H2AK119泛素化(H2AK119ub)宽域:在小鼠卵母细胞中,它们覆盖了约三分之一的基因组。ncH3K27me3富集在基因间区、非经典印记基因和缺乏DNA甲基化的非转录启动子,且与ncH3K4me3不重叠。这种组蛋白PTMs景观使得卵母细胞中的染色质处于一种“二价态”(bivalent state),并一直持续到植入后囊胚期。
H3K36甲基化(H3K36me):在小鼠卵母细胞的表观基因组调控中扮演关键角色。SETD2催化的H3K36me3在生长卵母细胞的转录基因体上发现,并在卵母细胞转录沉默后持续存在。H3K36me3积累与ncH3K4me3和ncH3K27me3宽域呈负相关。值得注意的是,H3K36me2和H3K36me3招募DNMT3A以指导这些转录基因体的DNA甲基化。H3K36甲基化的缺失会导致小鼠卵母细胞DNA甲基化景观发生显著改变,表明H3K36me3在为下一代建立表观基因组中发挥作用。
受精后的“染色质变奏曲”:可及性与核小体定位的动态重塑
精子和卵母细胞的表观基因组在受精时具有不同的染色质状态,合子亲本前核间也存在染色质不对称性。然而,受精后,这两个亲本基因组都会经历显著的重塑。
染色质可及性:在小鼠中,染色质可及性图谱在受精后6小时内,两个亲本前核在全局层面变得大致相似。但在人类胚胎中,父源染色质在4细胞期之前保持比母源染色质更强的可及性。ZGA之前的胚胎,无论小鼠、人类还是牛,其全局染色质景观都非常规,ATAC-seq信号“微弱而嘈杂”,峰值较少,基因组覆盖率降低。
核小体定位:早期2细胞期小鼠胚胎的核小体定位具有“模糊”的特点。随着发育的推进,核小体间距的规律性以及TSS下游清晰定义的+1核小体(+1 nucleosome)在小鼠和人类胚胎中逐渐出现。
基因组的“交通管制”:染色质三维组织与复制时间
染色质在核内的三维(3D)组织提供了表观遗传调控的额外层面。基因组折叠形成高度保守的组织结构,包括染色体区域(chromosome territories)、拓扑关联域(topologically associating domains, TADs)和A/B区室(A/B compartments)。
异染色质的“舞步”:从核仁样体到染⾊体中⼼
在分化细胞中,着丝粒周围异染色质(pericentric heterochromatin)在核内组织成“染色体中心”(chromocentres)。早期哺乳动物胚胎的核较大,并保持典型的“拉布尔构象”(Rabl configuration)。卵母细胞发生过程中的一个独特特征是着丝粒(centromeres)及其周围异染色质围绕“核仁样体”(nucleolar-like bodies)的空间排列,这对发育和异染色质沉默至关重要。这种3D排列在小鼠和牛胚胎中一直持续到ZGA。随后,染色体中心逐渐形成,这依赖于着丝粒周围RNA的转录,并伴随着其生物物理性质的变化,从液体样态(liquid-like state)转变为固体样态。
在人类胚胎中,父源和母源着丝粒周围异染色质都被经典的H3K9me3标记。然而,在小鼠受精卵中,父源着丝粒周围异染色质由Polycomb抑制复合物(Polycomb repressive complexes)及其相关PTMs建立,而母源着丝粒周围异染色质则由SUV39依赖的H3K9me3标记。
PADs的“隐秘世界”:特殊的表观遗传区域
小鼠卵母细胞3D基因组组织的另一个独特特征是“Polycomb相关域”(Polycomb-associating domains, PADs)的形成,这些域由H2AK119ub和H3K27me3标记的长程自关联形成。在小鼠中,PADs的形成及其内部基因的沉默依赖于PRC1介导的H2AK119ub,而非PRC2介导的H3K27me3。PADs,类似于ncH3K27me3,在2细胞期到8细胞期期间,仅在母源等位基因上短暂地重新出现。
LADs的“重生”:核纤层关联域的动态建立
“核纤层关联域”(Lamina-associated domains, LADs)在小鼠受精后立即形成,是核组织最早的形式之一。LADs在卵母细胞中检测不到,因此它们不通过母源生殖系遗传,而是在母源前核中“从头”建立。LADs的建立独立于DNA复制,但似乎涉及组蛋白PTMs。例如,H3K4me3对父源LADs在合子中的建立很重要,而KDM5B去甲基化酶的表达下调会导致父源前核中LADs的检测失败,但母源LADs基本不受影响。这表明LADs的建立和重构存在独特的、等位基因特异性机制。LADs在早期哺乳动物胚胎发育过程中,特别是ZGA前后,经历了显著的重塑。抑制转录会显著改变2细胞期LADs的组织。
A/B区室和TADs的“渐进构建”:基因组的区室化与折叠
小鼠卵母细胞在生长过程中逐渐失去核内的A/B区室,而精子则具有更规范的核组织。同样,在小鼠合子中,父源前核的区室化程度高于母源前核,尽管A/B区室在分裂阶段逐渐巩固。在人类和猪胚胎中也观察到区室的渐进建立。在全球层面,小鼠植入前胚胎中核区室的建立独立于ZGA时的转录,并且基本上不受DNA复制阻断的影响。这些区室具有与体细胞相似的转录和染色质特征,例如A区室富集H3K4me3和可及染色质,B区室富集DNA甲基化和H3K27me3。
拓扑关联域(TADs)的巩固在小鼠植入前发育过程中也逐渐发生,在8细胞期之前几乎检测不到。TADs的出现依赖于CTCF。令人惊讶的是,在小鼠CTCF缺失的胚胎中,尽管会导致发育失败,但并未观察到与结构相关的转录变化和首次细胞命运规格化不受影响,这表明TADs对建立基因表达程序并非必需,至少在植入前阶段是如此。在小鼠中,TADs的建立在很大程度上独立于ZGA时的转录,而在人类中,TADs的建立则受ZGA抑制影响。
复制时间的“动态图景”:生命时钟的节律
复制时间(replication timing)是指DNA在S期内复制的特定顺序,是主要的表观遗传特征。在分化细胞中,复制的协调顺序导致基因组区域被划分成早期复制域和晚期复制域,这与染色质特征和核组织高度相关。LADs和B区室(异染色质)通常与晚期复制域对应,而LADs间区域和A区室(常染色质)主要与早期复制相关。
在小鼠胚胎中,复制时间程序最初不明确且“模糊”,但在2细胞期后逐渐固化。合子和2细胞期胚胎的复制时间程序在细胞间的变异程度相似,但基因组区域间的异质性在合子中最大,随后从4细胞期开始逐渐减小。研究显示,ZGA基因的复制时间依赖于Pol II的存在,但独立于其转录延伸,这表明Pol II可能在独立于其转录活性的情况下,参与建立早期表观基因组。
早期胚胎的复制叉速度较慢,并随着发育进程而增加,这表明细胞可塑性的降低伴随着DNA复制叉速度的增加。在人类受精卵中,复制叉速度慢伴随着复制叉停滞和DNA损伤累积,这可能与人类胚胎高发的非整倍性(aneuploidy)有关。
关键调控因子:幕后“指挥家”的精妙协作
这场表观基因组的华丽舞蹈,离不开众多关键调控因子的精密协作。
组蛋白去乙酰化酶(HDAC1)和NAD+-依赖性SIRT1:参与H3K27ac的重塑,对早期胚胎发育至关重要。
CBP和p300组蛋白乙酰转移酶:其活性的瞬时抑制导致小鼠合子和早期2细胞期胚胎微弱和主要ZGA失败,胚胎停滞。它们的作用靶点包括早期2细胞期获得H3K27ac的远端区域。
KDM5A和KDM5B去甲基化酶:负责重塑卵母细胞中的非经典H3K4me3宽域。它们的下调会导致小鼠、牛和猪胚胎的ZGA失败。
KMT2B:在卵母细胞生长过程中建立非经典H3K4me3宽域。
SETD2:催化H3K36me3,对建立DNA甲基化景观至关重要。
DNMT3A:由H3K36me2和H3K36me3招募,指导基因体DNA甲基化。
MLX和RFX1转录因子:它们的结合基序与小鼠合子中的NDRs相关,其敲低会阻止父源染色质中NDRs的形成,并导致ZGA缺陷。
OCT4和YY1转录因子:在小鼠胚胎中,2细胞期远端NDRs的形成依赖于OCT4,而YY1在8细胞期对增强子样元件的规律性核小体阵列形成至关重要。
CTCF:在小鼠和人类胚胎中,TADs的出现和巩固依赖于CTCF。
RIF1:调节小鼠胚胎中复制时间的出现,但主要不改变LADs,这支持了基因组组织各层在早期胚胎中可能在分子层面上相对独立的观点。
这些分子层面的精妙调控,共同确保了早期胚胎发育中基因表达程序的正确执行和细胞命运的准确转变。
解锁生命最初的“黑箱”,惠及人类健康
这项深入早期哺乳动物胚胎表观基因组动态的研究,不仅仅是基础科学的突破,更对人类的健康和未来的生物技术发展具有深远价值。
点亮生育希望,预警发育风险
辅助生殖技术(ART)的优化:理解早期胚胎的表观遗传重编程机制,能够帮助研究人员和临床医生开发更精准的胚胎筛选标准。例如,通过评估胚胎染色质可及性、组蛋白修饰或复制时间的健康状态,来选择最有发育潜力的胚胎进行体外受精(IVF),从而提高成功率,减少反复植入失败和早期流产的痛苦。
遗传性疾病的预警与干预:研究揭示了某些表观遗传缺陷与早期发育停滞、染色体非整倍性甚至印记疾病(imprinting disorders)之间的关联。例如,人类受精卵复制叉速度慢并累积DNA损伤,可能与高发非整倍性有关。未来,基于表观基因组的早期诊断技术可能帮助识别具有发育风险的胚胎,甚至为潜在的早期干预提供靶点,避免某些先天性疾病的发生。
精准诊断与个性化治疗的基石
发育性疾病的病因探究:许多发育性疾病的根源可能隐藏在胚胎早期表观基因组重编程的缺陷中。深入研究这些机制,将有助于医生更好地理解这些疾病的分子病理,为未来的精准诊断和靶向治疗奠定基础。
临床实践的新策略:随着表观基因组学技术的成熟,医生未来可能会在临床上利用胚胎的表观遗传信息,进行更精细的风险评估和预后判断,甚至开发出针对表观遗传缺陷的个性化治疗方案。
生物技术的新蓝海
药物研发新靶点: 发现早期胚胎发育中关键的表观遗传调控因子(如HDAC1、KDM5A/B、SETD2等),为开发新型表观遗传药物提供了潜在靶点。这些药物可能用于改善生育功能、治疗某些发育性疾病或用于再生医学领域。
诊断工具与生物标志物开发: 胚胎表观基因组的独特特征,如“模糊”的核小体定位、特定的组蛋白PTMs分布或复制时间程序,都可能成为评估胚胎质量和发育潜力的非侵入性生物标志物。这将催生一系列新的诊断产品和技术。
再生医学与iPSC技术优化: 深入理解全能性到多能性的转换机制,能帮助研究人员更好地“重编程”体细胞,提高诱导多能干细胞(induced pluripotent stem cells, iPSCs)的效率和质量,使其更接近天然胚胎细胞,从而推动干细胞疗法和组织工程的发展。
未来的探索:跨越边界的融合
这项研究只是揭开生命奥秘的序幕。未来,我们还需要:
更深入的机制研究:阐明染色质特征与基因表达、转录因子结合之间的精确分子关系,尤其是通过对表观遗传修饰因子进行遗传操作后的更深入分析。
多组学数据整合:将已有的表观基因组数据与更多新的数据集进行整合,如基因表达谱、蛋白组学、代谢组学等,以构建更全面的早期胚胎生命图谱。
跨物种比较研究:进一步比较人类、小鼠和其他哺乳动物胚胎在表观基因组重编程中的保守性和特异性,以揭示普适性规律和物种差异。
与代谢的联动:探索胚胎独特的代谢特性如何与染色质调控相互作用,以及代谢产物如何影响表观基因组。
更精细的3D结构解析: 继续深入研究染色质高级结构的建立及其功能意义,例如,LADs的形成机制、A/B区室和异染色质域的动态变化。
早期胚胎的表观基因组,犹如一本记载着生命起源和命运蓝图的“活字典”。每一次分子层面的发现,都是我们更深入理解生命,并最终实现人类健康福祉的基石。让我们一同期待,未来在这片充满希望的领域,涌现出更多令人振奋的突破!
参考文献
Burton A, Torres-Padilla ME. Epigenome dynamics in early mammalian embryogenesis. Nat Rev Genet. 2025 Apr 3. doi: 10.1038/s41576-025-00831-4. Epub ahead of print. PMID: 40181107.
责编|探索君
排版|探索君
转载请注明来源于【生物探索】
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
来源:生物探索一点号1