Science | 细菌单细胞空间转录组学技术助力菌群研究

360影视 2025-02-25 01:39 1

摘要:单细胞在复杂环境中做出的决策是许多细菌现象的基础。基于成像的转录组学方法为研究此类行为提供了途径,但这些方法一直受到细菌mRNA 超高密度的阻碍。为了克服这一难题,我们将千倍体积扩展与多重容错荧光原位杂交(MERFISH, multiplexed error-

细菌中的多重高度空间转录组学

● 期刊:Science(IF:44.7)

● DOI:https://www.science.org/doi/10.1126/science.adr0932

● 原文链接: https://www.science.org/doi/10.1126/science.adr0932

● 第一作者:Ari Sarfatis

● 通讯作者:Jeffrey R. Moffitt(jeffrey.moffitt@childrens.harvard.edu)

● 发表日期:2025-1-24

● 主要单位:

美国马萨诸塞州波士顿儿童医院细胞与分子医学项目、美国马萨诸塞州波士顿哈佛医学院布拉瓦特尼克研究所微生物学系、美国马萨诸塞州剑桥市布罗德研究所

摘要abstract

单细胞在复杂环境中做出的决策是许多细菌现象的基础。基于成像的转录组学方法为研究此类行为提供了途径,但这些方法一直受到细菌mRNA 超高密度的阻碍。为了克服这一难题,我们将千倍体积扩展与多重容错荧光原位杂交(MERFISH, multiplexed error-robust fluorescence in situ hybridization)相结合,开发出了bacterial-MERFISH。这种方法能对单个细菌内的数千个操纵子进行高通量、空间分辨的基因表达谱分析。利用bacterial-MERFISH,我们解析了大肠杆菌对碳饥饿的响应机制,系统地绘制了亚细胞 RNA 空间组织结构,并描绘了肠道共生菌Bacteroides thetaiotaomicron对哺乳动物结肠中微米级生态位的适应性。我们预见bacterial-MERFISH 将广泛应用于研究细菌单细胞在多样化、空间结构化和原生环境中的异质性。

结果Result

bacterial-MERFISH 准确剖析大肠杆菌中的数千个操纵子

MERFISH 技术通过采用组合的、具有抗误差的荧光光学条形码,结合重复的单分子FISH(smFISH, single-molecule FISH)轮次,能够识别成千上万种不同的 mRNA 分子。然而,要解码这些条形码,来自不同分子的荧光信号必须是光学可分辨的。对于传统的高分辨率光学显微镜来说,每立方微米只能分辨出少量分子。对于真核系统,大量转录组部分可以在满足此限制的同时进行目标检测。相比之下,一个对数生长期的大肠杆菌细胞约含有8000个 mRNA 分子,细胞体积约为3 μm³,使得 mRNA 的总密度几乎比可用衍射极限成像分辨的密度高出三个数量级。因此,mRNA 的高密度限制了对超过少量细菌 mRNA 的成像,成为转录组规模成像的一个重大挑战。

图 1 | 基于图像的 E. coli 中数千个操纵子表达谱的bacterial-MERFISH

(A)用荧光显微镜可解析的 RNA 密度(左)和估算的 E. coli mRNA 密度(右)。(B) bacterial-MERFISH 的实验方案。(C-E) 固定的对数生长期 E. coli 在赖氨酸肉汤中培养后,染色16S rRNA 的图像(C),第一部分97个操纵子的 MERFISH 测量的图像(D),或两者的叠加图像(E)。比例尺:20微米。(F和G) 与 (C) 和 (D) 相同,但为50倍扩展的 E. coli。(H) 根据 (F) 和 (G) 中的细胞,通过 MERFISH 确定的 RNA 身份(颜色)。(I到K) 与 (F) 到 (H) 相同,但为1000倍扩展的 E. coli,染色有1057个操纵子文库的图像。(L) 未经过 DNase 处理的50倍扩展的1057操纵子 MERFISH 测量的每个视场的平均 mRNA 拷贝数与匹配培养的整体 RNA-seq 丰度对比。虚线表示从 RNA-seq 丰度最低的100个 mRNA 的平均 MERFISH 丰度估算出的假阳性率。TPM,百万次读取中的转录本数。(左) MERFISH 假阳性对照的分布(“空白”)。(M和N) 与 (L) 相同,但为经过 DNase 处理的50倍扩展1057操纵子 MERFISH(M)或1000倍扩展1930操纵子 MERFISH(N)。r,为对数表达之间的皮尔逊相关系数。(O和P) 不同 MERFISH 测量的与整体测序(O)或检测效率(P)的相关系数。条形图表示两个重复的平均值(标记)。(Q和R) 唯一操纵子的分布(Q)或总 mRNA 的分布(R)。标记表示平均值。

密度降低是应对这一挑战的一种自然途径。实际上,基于图像的单细胞转录组学方法通过将条形码信号分散在更多成像轮次中或利用扩展显微技术对样本进行物理膨胀来实现了适度的 RNA 密度降低。虽然这些方法可以实现约10倍的 RNA 密度降低足以将基于图像的转录组扩展到真核生物的全转录组规模,但这种密度降低仍然不足以达到细菌的相似分析,差距近两个数量级。

为克服细菌 mRNA 的密度问题,我们利用最近在扩展显微技术方面的进展,开发了一种针对细菌 FISH 优化的扩展工具箱,能够实现高达1000倍的体积扩展(图1B)。该工具箱补充了近期为非 RNA 目标开发的细菌扩展方法,虽然这些方法的扩展程度较为适中。简言之,我们将大肠杆菌培养至对数生长期,用配方甲醛(PFA)固定,然后消化细胞壁,在十倍稳健扩展(TREx)凝胶中扩展样本,随后将样本重新嵌入到不扩展的稳定凝胶中(图1B;材料和方法)。通过定制的扩展优化染色实验方案,我们用 16S 核糖体 RNA(rRNA)探针和针对97个大肠杆菌操纵子(表S1和S2;材料和方法)的 MERFISH 探针集对样本进行了标记。我们针对操纵子而非单个基因进行标记是因为来自同一多顺反子 mRNA 的不同基因的条形码信号由于信号重叠而无法识别,导致这些条形码被干扰。

扩展使大肠杆菌的宽度增加了 3.7 ± 0.8 倍(标准差,n = 4 个重复实验;图 S1A),并且宽度的细胞间变异性较小(图 S1B)。由于这种线性扩展与 ~50 倍的容积扩展一致(图 S1C),我们将此方法称为 50X 扩展实验方案。在经过 50X 扩展并使用 97 操纵子库染色的细胞中,观察到单个荧光颗粒,并通过 MERFISH 识别了这些分子(图 1, C 到 H)。这表明扩展足够充分,能够分辨出这一靶向库的 mRNA 密度。我们注意到,即使在没有特定 RNA 凝胶锚定化学物质的情况下,在 PFA 固定的扩展样本中也有大量分子可见,而在甲醇固定的扩展样本中则没有,这提示我们存在一种依赖于 PFA 的 RNA 锚定机制(图 S1, D 到 J)。

为了进一步探索 50X 实验方案下的多重化能力,我们使用针对 1057 个操纵子的 MERFISH 探针组对 50X 扩展的大肠杆菌进行了染色,约占大肠杆菌转录组的 40%(表 S1 和 S2;材料与方法)。尽管 mRNA 密度高于使用 97 操纵子测量时的观测结果,但仍能分辨出单个颗粒,并且许多分子能够通过 MERFISH 被识别(图 S1, K 到 M)。然而,我们注意到 RNA 信号重叠的频率有所增加(图 S1L)。为了应对这种重叠,我们开发了一种迭代扩展实验方案,该实验方案结合了 TREx 和先前的迭代策略。简而言之,用 50X 实验方案扩展和稳定的细胞在第二个 TREx 凝胶中进一步扩展,并嵌入第二个稳定凝胶中(图 1B)。该实验方案使细胞的宽度增加了 11.1 ± 2.2 倍(标准差,n = 4 个重复实验;图 S1A),扩展宽度的变异性保持在细胞间的适度水平(图 S1B)。由于这种线性扩展与 ~1400 倍的容积扩展一致(图 S1C),我们将这种方法称为 1000X 实验方案。当使用此实验方案扩展细胞时,在染色 1057 个操纵子的情况下,个别 RNA 的信号及其身份得以清晰区分(图 1,I 到 K)。值得注意的是,1000X 实验方案以 50X 扩展样本为起点(图 1B),便于探索特定样本所需的扩展程度。

根据大肠杆菌体积扩展三倍数量级的能力,我们设计了一个 MERFISH 文库,覆盖了 80% 的转录组,涉及1930个操纵子(表S1和S2;材料与方法)。用这一探针集染色的1000倍扩展样本显示出清晰的单分子信号,且重叠有限,这些 RNA 通过 MERFISH 技术得以识别(图S1,N至P),这表明1000倍的扩展足以进行大肠杆菌转录组中相当一部分的 MERFISH 分析。

值得注意的是,在 bacterial-MERFISH 早期开发过程中,我们观察到低表达操纵子的丰度与批量 RNA 测序的相关性较低(图1L)。这种相关性下降的程度远大于内部测量的假阳性率,这些假阳性率是由未分配探针的条形码提供的(图1L;材料与方法)。这一观察表明,可能存在依赖于细菌扩展的假阳性来源,我们推测这可能是由于扩展过程中探针与解链的基因组DNA结合。支持这一假设的证据是对脱氧核糖核酸酶(DNase)处理的使用,发现其能减少这一明显的假阳性率,使其与内部对照测量结果一致(图1M)。因此,我们得出结论,在 DNase 处理后,针对 DNA 的非特异性结合不是假阳性的主要来源。

为了评估 bacterial-MERFISH 的性能,我们对97、1057或1930个操纵子进行两次重复测量,并结合50倍或1000倍扩展处理于对数生长期的大肠杆菌中,分割这些图像中的细胞,并对 RNA 进行分类(图1,F至K,和图S1,K至P)。我们观察到这些测量结果与批量 RNA 测序之间存在强相关性,适用于从每细胞多拷贝水平到接近单拷贝以下的 mRNA(图1,M至O和图S2,A至C),这表明 bacterial-MERFISH 可以准确分析 RNA 表达,覆盖四个数量级的丰度,其下限由测量的假阳性率所设定。bacterial-MERFISH 测量在生物重复实验、扩展实验方案和多重化水平之间显示出强相关性(图S2,D至F),进一步支持该方法的准确性。

为了确定 bacterial-MERFISH 的灵敏度,我们接下来计算了检测效率,即实际被检测到的目标分子的比例(图1P,图S2G;材料和方法)。检测效率的值从针对近全转录组测量的7%(1930个操纵子)到 more-targeted 测量的高达50%(97个操纵子)不等,同时,扩展的额外提供了从10%到25%的增加(针对1057个操纵子的测量)(图1P)。正如预期的那样,每个细胞观察到的 mRNA 计数和唯一操纵子数量与多重化和检测效率的变化密切相关(图1,Q和R)。最后,尽管由于扩展导致成像通量下降,bacterial-MERFISH 可以成像大量细胞,其数量与之前通过 scRNA-seq 表征的细胞数量相当甚至更多(图S2H)。通过改变多重化和扩展的能力,可以平衡性能的不同方面,例如成像细胞数量与扩展程度之间的平衡,以最适合研究问题的需要。

尽管 bacterial-MERFISH 测量值与报告的在相似培养基中对 E. coli 的scRNA-seq 测量值呈现出较强的相关性,但实验方案的差异使得这两种方法灵敏度的定量比较变得复杂(图S3)。尽管如此,bacterial-MERFISH 的检测效率(图1P)与文献中关于 scRNA-seq 的报告值相比显得相当可观。类似地,每个细胞检测到的分子总数也可以与测序方法检测到的数量相当,尽管这些方法有能力检测所有转录物,而 bacterial-MERFISH 则是有针对性的。因此,这些测量共同表明,bacterial-MERFISH 是一种高性能且多功能的基于图像的细菌单细胞转录组学方法,能够以较低的假阳性率、大动态范围、检测效率和通量特点,补充 scRNA-seq方法。

bacterial-MERFISH 揭示了碳源变化过程中的异步分层响应

单细胞细菌转录组学的一个有前景的方面是能够识别细菌行为的异质性,并通过计算方法重新同步单个细胞对环境刺激的脱同步反应,从而揭示被种群平均值掩盖的动态反应。一个典型的动态反应是由碳源的切换引起的双糖滞后期 (diauxic shift)。细菌通常按优先顺序消耗不同的碳源,这一过程在一定程度上受到碳的抑制(carbon catabolite repression)的调控。在两种碳源的混合物中培养的细菌群体将优先消耗首选碳源,在双糖滞后期中暂停生长,然后再在不太偏好的底物上恢复增长。双糖滞后期的经典解释是表达第二种糖的利用机制所需的时间;然而,近期的单细胞研究表明,这一反应实际上受到亚群体的不同动态的影响。尽管如此,这些亚群体的多样性和转录组特征仍然定义不明确。

因此,我们重新审视了经典的双糖滞后期,采用了bacterial-MERFISH 技术。我们在定义的最小培养基中,以葡萄糖和木糖的混合物培养大肠杆菌(E. coli)(材料和方法)。正如预期,细菌培养在葡萄糖耗尽之前呈对数生长,在双糖滞后期中暂停生长,然后在木糖上恢复对数生长,最终在两种糖都耗尽后进入静止期(图2A)。我们在这个过程中收集了大肠杆菌细胞,分析了1057个操纵子的表达(图2,A到C),共分析了296,666个细胞,经过50倍扩增——这种多重化和扩增水平旨在平衡转录组范围的分析与被分析细胞的数量。为了提高实验效率,多个时间点的样本被组合并在单次 MERFISH 测量中分析,通过针对扩展实验方案优化的条形码16S rRNA 探针对细胞进行标记(图2B)。然后,将推测的细胞进行分割,将 RNA 分子分配给这些细胞,并通过16S rRNA 条形码进行条件解混(图2C;材料和方法)。

图2 | bacterial-MERFISH 显示对碳缺乏的随机层次响应

(A)大肠杆菌在含有葡萄糖和木糖的定义最小培养基中生长的600 nm 光密度。标记:生物重复,如果取样用于 MERFISH 则标记为彩色。(B) 16S rRNA 样本的多重化策略。(C) rRNA 图像按识别的采样条件着色(左),分割的细胞边界也以类似的颜色着色(中),识别的 RNA(颜色;右)用于 50X 扩展的1057个操纵子 MERFISH 测量。rRNA 颜色与 (A) 中定义相同。比例尺:20微米。(D) 按采样条件测量的平均基因表达的 z-score,如 (A) 所列。(E至G) UMAP 图,按条件着色(E),Leiden 聚类(F)或归一化基因表达的自然对数(G)着色。聚类按丰度编号,并标记为生长(“G”)或非生长(“N”)。(H和I) 按 z-score 测量的标记基因表达(H)和每个条件中各聚类的相对比例(I)。(J和K) 收集自葡萄糖对数阶段或二氧化物转变的细胞的前两个扩散成分的散点图,按条件着色(J)或拟时序着色(K)。(L) 在不同拟时序下测量的平均碳利用操纵子表达的 z-score。编码转运蛋白的操纵子标签用蓝色标识PTS转运蛋白,用绿色标识非PTS转运蛋白。(M) 按条件分布的拟时序值。

多项观察支持了这些测量和分析。我们发现,通过 MERFISH 测定的平均RNA 表达在生物学重复之间有很强的相关性,与在不同生长阶段的批量 RNA测序结果,以及在相似条件下通过单细胞 RNA 测序的平均丰度一致(图 S4,A 到 E)。此外,细胞群体表现出预期的表达模式(图 2D),在生长期间收集的细胞表达与氨基酸合成相关的操控子(例如,argG 和 ilvC)、翻译(例如,tff-rpsB-tsf 和 cmk-rpsA-ihfB)和好氧呼吸(例如,atpIBEFHAGDC)的基因,而在二氧化碳转变期间和静止期收集的细胞则表达与应激反应相关的操控子(例如,nlpD-rpoS)和葡萄糖异生(例如,glpFKX 和 glpD)的基因。最后,尽管复制之间的有效检测效率存在差异,但两个复制在细胞每个计数的趋势上显示出相同的变化,即在生长条件下每个细胞的计数高于非生长条件(图 S4,F 和 G)。在其他培养基中的细菌生长中,其他单细胞方法也观察到了类似的趋势。

为了探索细胞对这种碳源转换的反应异质性,我们整合了两个生物学重复样本的测量结果,通过均匀流形近似和投影(UMAP)可视化单细胞异质性,并进行 Leiden 聚类以区分亚群(图2,E至I;材料与方法)。在相似生长阶段收获的细胞在很大程度上是共整合的(图S4,H和I),这支持了我们的分析。然而,即使是微小的转录差异,例如在葡萄糖或木糖对数生长期收集的细胞之间的差异,也被解析了出来(图2E和图S4J)。这一分析揭示了单细胞水平上丰富的行为多样性。细胞被组织成两大组,分别对应于来自生长或非生长条件的细胞(图2E),并被进一步细分为14个不同的簇(图2F)。这些簇具有独特的基因表达谱(图2,G和H)以及在不同条件下的不同丰度(图2I)。多条证据支持了这种异质性。在两个重复样本中均观察到了各个簇(图2I),每个簇都标记了多个与相关生物过程相关的操纵子(图2H),标记表达在重复样本之间是保守的(图S5A),驱动不同簇出现的操纵子协方差在重复样本之间是保守的(图S5,B至E),当单独分析每个条件时,识别出与所有细胞联合分析时看到的相似操纵子集共表达的簇(图S6),最后,单分子荧光原位杂交(smFISH)在未扩增的大肠杆菌中证实了簇标记物的共表达(图S7)。

在对数生长期,我们识别出了一系列亚群的多样性(图2,E至I),其中包括与翻译和氨基酸运输相关的簇(G0,标记为 tff-rpsB-tsf 和 lysP);嘌呤碱合成相关的簇(G6,标记为 carAB、codBA 和 purHD);精氨酸合成相关的簇(G7,标记为 argG、argD 和 argCBH);丝氨酸生物合成相关的簇(G4,标记为 serA 和serC-aroA);硫酸盐利用相关的簇(G11,标记为 cysDNC 和 cysJIH);蛋白质折叠相关的簇(G12,标记为 dnaKJ、groSL、hslVU、clpB 和 htpG);以及运动性和趋化性相关的簇(G3,标记为 motRAB-cheAW、fliDST 和 tar-tap-cheRBYZ)(图2H)。许多这些生化过程是细胞在极简培养基中生长所必需的,然而,我们的分析发现,只有细胞亚群表达了这些必需操纵子的高水平,这表明了一种模型,即这些途径的稳态、群体水平的表达并非由所有细胞的均匀表达产生,而是由短暂、协调的表达爆发产生,这些爆发在时间上平均达到所需的水平。这一观察结果与通过活细胞成像揭示的启动子活性的短暂爆发一致。此外,这一观察结果也得到了在类似限定培养基中对大肠杆菌进行的最新单细胞转录组测序(scRNA-seq)测量的支持,这些测量也突出了与类似细胞过程共表达的基因簇,例如细胞运动性(G3,标记为 motRAB-cheAW、flgBCDEFGHIJ 和 tar-tap-cheRBYZ)和氨基甲酰代谢(carAB)进入精氨酸合成(G7,标记为argG、argD 和 argCBH)以及嘌呤碱合成(G6,标记为 purHD 和 lapAB-pyrF-yciH)。综合这些测量结果,现在表明这种爆发是广泛存在的,并且并非在单个操纵子水平上产生,而是在共同调控因子的上游产生。

在双糖滞后期期间,我们也观察到了类似的异质性程度(图2,E至I)。只有部分簇表达了与木糖利用相关的操纵子(N2和N10,均标记为 xylAB、xylE、xylFGHR 和 yagGH),而大多数在双糖滞后期的簇表达了与培养基中未包含的碳源利用相关的操纵子(图2,E至I)。这些碳源包括甘露糖和甘油(N1,标记为 manXYZ、glpABC 和 glpTQ);麦芽糖(N9,标记为 malEFGH、malKM-lamB 和 malPQ);阿拉伯糖(N10,除了木糖相关操纵子外,还标记为 araE-ygeA、araFGH 和 araBAD);山梨醇和乙醇酸(N8,标记为 mtlADR 和 glcDEFGBA);以及乙酸和腐胺(N5,标记为 acs-yjcH-actP、puuAP-ymjE 和 puuDRCBE)(图2,H和I)。N13与 G3 类似,标记为趋化性和运动性操纵子。然而,这些簇通过与肽类趋化性(G3;例如 tar-tap-cheRBYZ 和 tsr)或糖类趋化性(N13;例如 trg和 aer)相关的操纵子加以区分,反映了与这些簇相关的条件之间的不同营养需求(图2H)。

我们还注意到特定碳源探索存在明显的时间顺序。为了研究这种顺序,我们通过拟时序分析(pseudotime analysis)从葡萄糖对数生长期计算同步细胞,贯穿整个双糖滞后期(材料与方法)。该分析不仅重现了双糖滞后期采样的顺序(图2,J和K),支持了拟时序排序,还揭示了碳源利用操纵子表达的时间级联(图2L)。这一级联从与葡萄糖相关的操纵子(例如 ptsG)开始,然后依次经过与糖原(例如 segA-pgm)、肽聚糖回收(例如 folP-glmM)以及三羧酸循环入口(例如 pdhR-aceEF-lpd)相关的操纵子,与碳源储备的动员一致。随后,级联从主要的非葡萄糖磷酸转移酶系统(PTS)碳水化合物利用(例如 manXYZ、nagE、gatYZABCD 和 mglBAC,分别对应甘露糖、N-乙酰葡糖胺、半乳糖醇和半乳糖)转变为主要的非PTS碳源利用(例如 malEFGH、ugpBAECQ 和 glcDEFGBA,分别对应麦芽糖、甘油-3-磷酸和乙醇酸)——这与在葡萄糖之后,非葡萄糖PTS碳水化合物优于非PTS碳水化合物的观点一致。这一进程最终以木糖(例如xylFGHR 和 xylAB)利用操纵子的上调告终,最终是阿拉伯糖(例如 araFGH和 araBAD)利用操纵子的上调。在拟时序后期观察到的木糖和阿拉伯糖利用操纵子的短暂共表达(图2L)可能代表了碳源进展的过度,这是由于木糖利用操纵子转录与木糖功能利用转换之间存在滞后。

碳源利用操纵子并非在拟时序进程中差异表达的唯一途径。将这一分析扩展到任何表达的操纵子,揭示了在双糖滞后期期间转录组的丰富重塑(图S8和表S3)。值得注意的是,这一分析进一步支持了拟时序排序,因为静止期标记物(例如 katE、aldB 和 puuDRCBE),这些标记物可能表明细胞处于更严重的应激和饥饿状态,在拟时序后期值中最为富集。更广泛地说,这一分析表明,观察到的碳代谢中的转录进程应被视为更广泛转录反应的一部分。

每种转变条件下观察到的拟时序值范围与其他条件的范围有重叠(图2M),这与一种随机响应模型一致,即细胞在沿着碳源层次结构的进展过程中是不同步的。最简单的模型是每个细胞最终都会探索整个碳源范围;然而,值得注意的是,作为时间上的一个静态快照,我们的数据并不能排除一种模型,即某些碳源仅被部分细胞探索。

综上所述,这些结果共同表明,必需途径的稳态水平可以通过整个调控网络中短暂且协调的表达爆发来维持,而且当面临碳源饥饿时,大肠杆菌采用了一种响应性多样化策略,其中葡萄糖的缺失触发了沿着碳源利用操纵子的随机、层次性进展。我们建议,凭借能够表征亚群并计算同步进行动态响应的细胞的能力,bacterial-MERFISH 有望在剖析编码这种细胞异质性的多样化调控机制方面发挥重要作用。

bacterial-MERFISH 技术揭示了信使核糖核酸在细胞内的多种定位模式

基于图像的单细胞转录组学方法的另一个优势在于能够测量细胞内转录组的组织情况。特定的细菌 mRNA 被定位到细胞质、膜、极、染色体复制起点或细胞内细胞器表面,这是通过低通量的 mRNA 成像或生化分离确定的。这种组织被认为在蛋白质分选、复合物组装和 mRNA 转录后调控中具有功能作用。然而,由于尚未在转录组水平上对 RNA 定位进行成像,其范围和多样性仍不清楚。

为了探究转录组的空间组织,我们利用了在肉汤培养基(LB)中生长的 50 倍扩增的 1057 个操纵子的测量数据。为了确定细胞内 RNA 的定位,我们将每个 mRNA 分子映射到其在每个细胞内的轴向和径向位置,并将这些坐标归一化为细胞的长度和宽度(图 3A;材料与方法)。然后,我们计算了每个 mRNA 在所有测量细胞中的平均轴向和径向分布(图 3B 至 D;材料与方法)。与之前在 中的报告一致,我们发现了在细胞质中富集的 mRNA(例如 dnaKJ)、在膜上富集的 mRNA(例如 ptsG)以及在极区富集的 mRNA(例如 dnaB)(图 3C 和 D)。然而,我们也注意到这些主要模式存在多样性变化,有 mRNA 在膜的不同位置富集、在多个细胞质位置富集或集中在单个中心焦点(图 3E)。这些模式在重复测量中得以重现(图 S9A 至 C),并且在 1000 倍扩增的 MERFISH 测量中也得到了验证(图 S9D)。此外,由于样本扩增可能会引入一定程度的失真,我们还用未扩增的 smFISH 对少量操纵子进行了验证,并观察到了高度相似的定位模式(图 3F)。

图 3 | 转录组以多种模式组织,这些模式由蛋白质组和基因组的组织方式所塑造

(A)将 mRNA 映射到标准化的细胞坐标系中。(B)在 LB 对数期中,使用 50 倍扩增的 1057 操纵子 MERFISH 测量的、(中部)或(底部)mRNA 的位置。mRNA 被映射到正轴向中细胞距离和径向坐标(红色上象限)并镜像(灰色象限)以进行可视化和分析。(C 和 D)沿径向和轴向(C)或径向(D)方向绘制(B)中定位的平滑、标准化 RNA 密度。(E)与(C)相同,用于说明性 mRNA 集合。(F)单个操纵子的未扩增 smFISH 的单个平面的平均、标准化 RNA 信号。(G)mRNA 空间分布的 UMAP,按聚类着色,并分别用名称或编号标记(C)或(E)中的示例。此分析仅包含通过最小表达阈值的 510 个操纵子(材料和方法)。(H 和 I)与(G)相同的 UMAP,按预测的编码蛋白位置着色,内膜(H)或细胞质(I)。(J)每个 RNA 定位聚类中蛋白质位置标签的富集。颜色:聚类。大小:具有标签的操纵子的分数。边界:富集的重要性(“y”为经 FDR 校正后的值

为了进一步对这种空间多样性进行分类,我们利用模式相似性度量来可视化和聚类空间模式(材料与方法)。该分析产生了五个主要的 mRNA 分布簇(图 3G),这些簇内部显示出一定程度的连续空间变化。细胞质簇包括细胞质均匀填充的模式(例如 dnaKJ 和 glnS)、细胞内多个焦点(例如 uxuAB 和 groSL)或中心密度增加(例如 metG)的模式。具有强烈中心焦点的 mRNA(例如 adhE 和 rnb)定义了中细胞质簇。膜簇由膜富集的弥散模式(例如 ptsG 和 cydAB)或在极点或其附近膜富集(例如 yifK、kgtP 或 yojI)的模式定义,而中细胞膜簇则由仅在细胞中间强烈膜富集(例如 dtpA 和 pntAB)的模式定义。最后,极化簇由极点附近的弥散(例如 mreBCD)或尖锐的细胞质焦点(例如 metBL)的模式定义。一些位于簇边界的 mRNA 显示出与附近簇中 mRNA 相似的特征(例如 proS 和 proP),这突显了空间模式的连续变化。

为了探究可能的模式形成机制,我们研究了簇与 mRNA 特征之间的相关性。转录本长度、GC 含量、丰度和半衰期与空间分布的相关性较弱(图 S10,A 至 H),而编码蛋白位置的相关性较强(图 3,H 至 J,以及图 S10,I 至 N)。具体而言,包含编码至少一种内膜蛋白的 mRNA 的操纵子在膜相关 RNA 定位簇中富集,而编码细胞质蛋白的 mRNA 在细胞质内的簇中富集(图 3J)。这些观察结果与先前对单个 mRNA以及全转录组 mRNA 组的测量结果一致;与内膜蛋白的共翻译插入机制一致,该机制会在翻译过程中将 mRNA 集中在膜上;也与内膜蛋白编码 mRNA 中富含膜相关序列特征的报告一致。为了测试共翻译插入在多大程度上导致膜定位,我们使用内膜蛋白中注释的跨膜结构域的存在作为共翻译插入的替代指标。在膜或中细胞膜簇中的 213 种 RNA 中,我们发现有 143 种编码内膜蛋白的 RNA 至少有一个跨膜注释(图 S10O),而所有 297 种细胞质富集 RNA 中仅有 33 种,这进一步支持了共翻译插入在膜定位中的作用。

同时,转录 mRNA 的基因组位点也与空间模式高度相关。位于细胞中部胞质或细胞中部膜簇中的 mRNA 更倾向于由靠近复制终止区的基因组位点编码,而其他簇中 mRNA 的基因在该染色体区域则较少(图 3K 和图 S10P)。在快速生长条件下,染色体的组织方式是 位于细胞中心,而 以及左、右染色体臂在细胞极附近复制。这种结构在细胞周期的大部分时间里得以维持,新分裂细胞极部的极性宏域会迅速移动到细胞中心。实际上,细胞周期所有阶段(图 3L 和 M)或部分阶段(图 S10Q)的 mRNA 轴向分布平均值与这种组织方式一致。

我们目前的测量结果将之前提出的关于细菌转录组组织的两种模型统一了起来——即要么是基因组特征,要么是蛋白质组特征决定组织。具体而言,我们表明这两种特征都在 mRNA 的全局组织中发挥作用,蛋白质位置决定了细胞质与膜的富集情况,而基因组特征则决定了细胞质和膜上的轴向富集情况。尽管如此,我们还是发现了多个 mRNA 的空间模式偏离了这些全局规则,包括不编码已知内膜蛋白的膜富集 mRNA(图 S11,A 和 B)、编码具有注释跨膜结构域的内膜蛋白的细胞质富集 mRNA(图 S11,C 和 D),以及许多空间模式与其基因组位置预测不一致的 mRNA(图 S11,E 至 G)。这些例外情况表明可能存在尚未发现的 mRNA 特异性定位机制,并且这些例外情况除了全局模式外,可能还具有功能意义。bacterial-MERFISH 技术为测量此类模式提供了一种直接的方法,这将极大地促进对细菌转录组细胞内组织的机制和功能研究。

bacterial-MERFISH 技术揭示了肠道共生菌对结肠中不同生态位的适应性

基于图像的单细胞转录组学方法也有望能够探究复杂且具有空间结构的环境中基因表达情况。为了探究bacterial-MERFISH 的这一能力,我们利用了单菌定植的无菌小鼠,定植菌为人类肠道共生菌(图 4A)。由于能够从丰富的饮食来源以及宿主分泌到黏液层的多糖中获取大量多样的多糖,我们推测可能会根据局部多糖的可用性来调节其多糖利用,正如先前所提出的。为了探究这一可能性,我们设计了一个 MERFISH 检测板,涵盖了多糖利用位点(PUL)内的多种转运蛋白(即淀粉利用系统 SusC 样蛋白)、通常与 PUL 表达调控相关的混合双组分系统(HTCS)以及少量与中央代谢和其他细菌功能相关的基因,总共针对 159 个操纵子(图 4B 和表 S1、S2 和 S4)。

图 4 | 哺乳动物结肠中一种肠道共生菌对微米级生态位的适应

(A 和 B)从单菌定植的小鼠结肠中取出结肠,进行固定、切片和展开处理(A),并对其执行针对 159 个操纵子(包括多糖利用位点(PUL)、杂合双组分系统(HTCS)和其他操纵子)的 MERFISH 检测(B)。(C)未展开的结肠切片,用 16S rRNA(红色)、DAPI(蓝色)和饮食残渣自发荧光(绿色)染色。黄色表示多个通道中的自发荧光。比例尺:500 微米。(D)50 倍放大的结肠切片,用 DAPI(蓝色)和 MERFISH 测量的第一部分(洋红色)染色。比例尺:200 微米。(E 和 F)(D)中成像的两个细胞的 MERFISH 测量的第一部分(E)和 RNA 身份(F)。比例尺:10 微米。(G)所有(灰色)或单个 RNA(红色)的空间分布。宿主组织已标记。比例尺:1 毫米。(H 和 I)斑块基因表达的 UMAP 图,按第一扩散系数(DC1,H)或到宿主组织的距离(I)着色。(J)具有低、中、高 DC1 值的斑块与宿主组织距离的分布。线条:中位数。(K)图(G)所示切片中低(蓝色)、高(橙色)或所有(灰色)DC1 值斑块的空间分布。(L)高 DC1 值斑块与低 DC1 值斑块中操纵子表达的富集显著性与对数倍数变化。标记:基因类型。标记填充颜色:已知的 PUL 底物。彩色区域表示 FDR 校正后的值

随后,我们从单菌定植的小鼠体内切除结肠,样本经过甲酸固定、石蜡包埋和切片处理(图 4A;材料与方法)。在未扩增的切片中,16S rRNA 染色显示,从靠近宿主上皮层的无菌内黏液层中几乎检测不到 ,而在外黏液层附近则有富集,且在整个结肠腔内的密度变化不定(图 4A 和 C)。接着,我们采用改良的 50 倍扩增方案对切片进行扩增,并用 MERFISH 对其进行染色。16S rRNA 信号显示,尽管饮食残渣有明显损失,但 B. theta 的分布基本得以保留(图 4C 和 D;材料与方法)。通过 MERFISH 可以在单个细胞中识别出单个 mRNA(图 4E 和 F)。在该结肠横截面中,我们观察到许多操纵子的表达在空间上存在差异。有些 mRNA 在整个腔内均有表达(例如 BT_0364 和 BT_4671),而其他一些则在黏液层附近表达更为显著(例如 BT_3958 和 BT_2894)(图 4G)。未扩增样本的多色 smFISH 实验也支持了这些表达模式(图 S12)。

为了量化这种空间变化,我们在两只小鼠的结肠中选取了六个切片进行这些测量。每只结肠都采用两种不同的固定方法之一进行固定,以控制潜在的固定依赖性伪影(材料与方法),这些伪影影响很小,这一点从这些测量结果之间的强相关性可以得到证明(图 S13,A 至 C)。由于 PUL 表达可能较低(图 S12),我们对包含约 5 个细胞的小空间区域的基因表达进行了平均,并使用 UMAP 和扩散图可视化了这些区域间的转录变化(图 4H 和图 S13,D 至 F)。在靠近黏液层或贯穿整个腔体中表达更显著的单个基因定义了此 UMAP 中的不同区域(图 S13,D 和 E),并且扩散分析表明,由第一扩散成分(DC1)捕获的重要基因表达变化轴与黏液距离有关。低 DC1 值的区域在黏液附近富集,而高 DC1 值的区域则在整个腔体中分布得更为均匀(图 4,H 至 K 和图 S13F),这表明黏液距离是基因表达的一个协变量。更广泛地说,尽管这些观察结果表明黏液邻近性是表达变异的一个具有统计学意义的协变量,但我们的数据还表明局部空间异质性可能会产生类似的规模变化,而其他空间协变量仍有待描述。一些样本显示出具有独特基因表达模式的管腔区域(图 S13G),整个管腔内低 DC1 表达特征(图 S13H 至 M),以及管腔深处存在低 DC1 补丁和靠近黏液处存在许多高 DC1 补丁(图 S13N)。

为了确定与 DC1 相关的黏液近端适应性背后的操纵子,我们将空间区域分为低 DC1(黏液相关)或高 DC1(管腔相关)区室。我们发现这两个区室之间有 38 个操纵子存在显著的富集差异(图 4L 和表 S4),当分别分析两种固定方法的样本时,富集操纵子有大量重叠(图 S13,O 至 R)。黏液相关或管腔相关区室之间差异表达的基本基因类别存在明显差异。15 个管腔相关操纵子中有 9 个与中心代谢有关,而 23 个黏液相关操纵子中没有一个具有这种功能注释(图 4L 和表 S4),这表明管腔中的 可能相对于靠近黏液层的上调中心代谢的元素。相比之下,所有 23 个黏液相关操纵子都包含 或 PUL 相关的 HTCS 基因,而 15 个管腔相关操纵子中只有 5 个具有这种基因,这表明黏液相关生态位接下来,我们对每个隔室中富集的 PUL 的已知底物进行了研究。在已知底物的黏液相关 PUL 中,有 10 种针对宿主黏液多糖,而只有一种针对膳食多糖(图 4L 和表 S4)。相比之下,在腔内隔室中,已知底物的三个 PUL 中有两个针对膳食多糖(图 4L 和表 S4)。这些观察结果与在黏液层附近宿主来源多糖更易获取的预期相符,支持了我们的空间分析。此外,在黏液相关斑块中富集的 23 种 PUL 中,有 10 种底物未知(图 4L 和表 S4)。鉴于我们观察到这些操纵子在黏液相关斑块中富集,我们推测这些 PUL 针对宿主来源的多糖或该局部环境中富集的其他碳水化合物。支持更广泛的多糖多样性获取。

我们的测量结果补充了之前一项关于基因表达空间变化的显微解剖研究,通过提供直接的微米级测量结果以及扩展了黏液富集 PUL 的列表,或许是因为空间分辨率提高、灵敏度改善或两次研究之间的生物学差异。进一步强调了bacterial-MERFISH 提供的改进空间分辨率的重要性,我们发现,仅基于宿主邻近性对斑块进行简单分类,对于检测我们所分析样本数量的差异表达操纵子来说,效力不足,尽管它揭示了管腔和黏液近端富集趋势,这在很大程度上与上述观察结果一致(图 S14)。

总的来说,这些测量结果表明,细菌会精细调节基因表达以适应肠道内的微米级生态位。借助bacterial-MERFISH 技术,现在应该能够对各种复杂环境中的这种微米级适应情况进行详细分析。

作者简介

波士顿儿童医院 Ari Sarfatis 为本文第一作者,哈佛医学院和波士顿儿童医院 Jeffrey Moffitt 教授为本文通讯作者。

Jeffrey R. Moffitt(通讯作者)

Jeffrey R. Moffitt,波士顿儿童医院助理教授,主要研究重点是了解肠道微生物组和宿主肠道的空间组织,进而理解这种空间组织如何调节宿主感知和塑造微生物组组成及活性的机制,以及微生物组如何重塑宿主生理的许多不同方面。相关研究成果发表在Science、Nature Reviews Genetics 和 Nature Biotechnology等杂志上。

翻译:杨海飞,青岛农大、基因组所联培硕士在读;

审核:朱志豪,广东医科大学,基因组所联合博士后;

终审:刘永鑫,中国农科院基因组所,研究员/博导;

排版:荀佳妮,中国农科院基因组所,生物信息学硕士在读

宏基因组推荐

1月10-12日,单菌基因组组装、注释、遗传表征、分子分型、系统进化和传播溯源

2月21-23日,家系、肿瘤临床基因组/外显子组数据分析

3月21-23日,高级转录组分析和R语言数据可视化

3月28-30日,第二届全国基因组信息学大会

4月11-13日,微生物组-扩增子16S分析

5月11-13日,微生物组-宏基因组分析

来源:微生物组

相关推荐