Nature Methods | “双剑合璧”!SUM-seq重塑单细胞多组学图谱,引领科研新范式

360影视 动漫周边 2025-05-29 18:27 4

摘要:我们体内数万亿个细胞,它们如何各司其职,从最初的单一受精卵分化出肌肉、神经、免疫等千差万别的细胞类型?又或者,当疾病来袭,细胞内部的“指令”为何会出错?这一切的奥秘,都隐藏在一个极度复杂而精密的“指挥中心”——基因调控网络 (gene regulatory n

我们体内数万亿个细胞,它们如何各司其职,从最初的单一受精卵分化出肌肉、神经、免疫等千差万别的细胞类型?又或者,当疾病来袭,细胞内部的“指令”为何会出错?这一切的奥秘,都隐藏在一个极度复杂而精密的“指挥中心”——基因调控网络 (gene regulatory networks, GRNs)。在这个庞大的网络中,增强子 (enhancers) 就像乐谱上的强音记号,标记着何时何地该强调哪些基因的表达;而转录因子 (transcription factors, TFs) 则是无数的指挥家,它们精准地“抓取”这些记号,决定着细胞的“交响乐”如何演奏,从而塑造细胞的身份、功能乃至对外界刺激的响应。

然而,要真正理解这场生命交响乐的每一个细节,并同时捕捉到染色质(基因组的包装形式,决定基因是否可被读写)的开放性(chromatin accessibility)和基因的实时表达(gene expression)状态,一直是个巨大的挑战。传统的单细胞技术,如单细胞RNA测序 (single-cell RNA sequencing, snRNA-seq) 或单细胞ATAC测序 (single-nucleus assay for transposase-accessible chromatin sequencing, snATAC-seq),尽管各有千秋,但它们往往只能提供单方面的“视角”,就像你只能听到交响乐团的弦乐声部,却无法同时感受铜管和打击乐的震撼。更令人头疼的是,现有的一些多组学技术,虽然能同时测量这些信息,却往往受限于可扩展性 (scalability)、多重分析能力 (multiplexing capability) 和昂贵的成本效益 (cost effectiveness),使得大规模、多样本的深度研究变得遥不可及。

如果有一种技术,能够以超高的通量、极低的成本,同时“监听”数百万个细胞核内基因的活跃度,并“观察”它们的染色质是开放还是紧闭,那将为我们揭开细胞命运的神秘面纱带来怎样的革命?5月26日《Nature Methods》的研究报道“Single-cell ultra-high-throughput multiplexed chromatin and RNA profiling reveals gene regulatory dynamics”,介绍了一项新的技术——单细胞超高通量多重测序 (Single-cell Ultra-high-throughput Multiplexed Sequencing, SUM-seq)!这项突破性技术犹如一把“万能钥匙”,它以前所未有的精度和效率,不仅在物种混合实验中表现出极低的碰撞率(唯一分子标识符UMI碰撞率仅0.1%),还成功地在巨噬细胞 (macrophages) 极化过程中捕捉到其转录因子活性的精妙动态,揭示了T辅助细胞 (T helper cells) 各亚型独特的调控景观,甚至在阵列式CRISPR筛选中,精准剖析了关键谱系转录因子(如GATA2、NR4A2、SOX17)对诱导多能干细胞 (hiPSCs) 命运走向的深远影响。

SUM-seq的出现,正以前所未有的势头,将单细胞多组学研究推向一个全新的高度。它不仅是一个强大的科研工具,更是一个充满无限可能性的“解码器”,为我们深入理解细胞分化、疾病发生机制以及药物响应等生命科学的核心问题,铺平了道路。

颠覆性技术揭秘:SUM-seq的“独门秘籍”与超凡性能

要理解SUM-seq为何如此强大,我们首先要了解它的核心原理。SUM-seq巧妙地结合了组合式流体索引 (combinatorial fluidic indexing) 和单重多组学分析的优势,实现了对数百个样本、百万级别细胞的单细胞RNA/ATAC图谱分析。

这项技术的“独门秘籍”在于其精巧的两步式条形码标记策略。

原理示意图(Credit:Nature Methods

第一步:样本内索引。研究人员首先分离并固定细胞核,然后将它们平均分配到多个样本中。在这一阶段,他们引入了独特的样本索引 (sample indices)。对于染色质可及性分析 (ATAC),转座酶 (Tn5) 会被预加载上带有条形码的寡核苷酸 (barcoded oligos),用于标记可及的基因组区域。而对于基因表达分析 (RNA),带有条形码的寡核苷酸 (barcoded oligo-dT primers) 则通过逆转录 (reverse transcription, RT) 来索引mRNA分子。这意味着,在进入微流控系统之前,每个样本的ATAC和RNA分子就已经被打上了样本专属的“身份证”。

第二步:液滴内索引。接下来,所有经过第一步标记的样本被混合并加载到微流控系统中,例如10x Chromium平台。在这个系统中,细胞核被封装在微小油滴 (droplets) 中,每个油滴内通常包含多个细胞核。在油滴内部,系统会引入第二层条形码 (droplet barcode),对油滴内的所有分子进行再标记。这种双重条形码标记策略 (dual barcoding) 确保了即使同一个油滴中含有多个细胞核,也能将测序读段精确地分配回其原始的单个细胞核。

SUM-seq的计算分析流程也同样高效。它使用自主开发的Snakemake分析管线 (Snakemake pipeline),能够可扩展且可重复地将测序读段分配给相应的样本索引,并通过液滴条形码进行单细胞级别的解复用。最终,生成基因表达矩阵 (gene expression matrix) 和染色质可及性矩阵 (tile matrix),并根据共享的样本索引和液滴条形码组合来匹配两种模态的数据。

那么,SUM-seq的性能究竟如何呢?

在评估和优化数据质量的实验中,研究人员将人类白血病细胞 (K562) 和小鼠成纤维细胞 (NIH-3T3) 以等比例混合,并使用了16个样本索引进行SUM-seq分析。

高通量与高回收率:实验成功地从10万个双条形码细胞核中恢复了6,215个人类细胞和7,607个小鼠细胞的双模态数据,总回收率高达70%,这意味着与标准工作流程相比,通量提高了约7倍。

极低的碰撞率:关键的是,人类和小鼠的读段分离良好,唯一分子标识符 (UMI) 碰撞率仅为0.1%,ATAC片段碰撞率为3.8%,这表明SUM-seq能够非常有效地区分不同细胞的来源,保证了数据纯度。

媲美甚至超越现有技术: 在性能指标上,SUM-seq的单细胞RNA (UMIs和每细胞基因数) 和单细胞ATAC (每细胞峰区片段数、转录起始位点 (TSS) 富集分数、片段大小分布) 模态数据质量持续保持高水平。与目前其他超高通量单细胞RNA测序、单细胞ATAC测序和多组学方法相比,SUM-seq在文库复杂性指标(每细胞基因数和峰区片段数)方面表现出色。例如,SUM-seq的平均基因数可达2,058个,平均片段数可达5,164个,远超其他高通量方法。例如,另一款流行的单细胞ATAC测序技术,dsciATAC-seq,其K562细胞的平均片段数仅为198个,基因数仅为355个。尽管10x Multiome的平均基因数可达2,515个,平均片段数可达9,258个,看似略高于SUM-seq,但其每细胞成本高达0.35欧元;而SUM-seq的每细胞成本低于0.05欧元,显著降低了研究成本,使得百万细胞级别的大规模研究成为可能。

固定和冷冻样本兼容:值得一提的是,研究发现,甘油基冷冻保存 (glycerol-based cryopreservation) 在甘油醛固定 (glyoxal fixation) 后对测序性能指标影响最小,这使得SUM-seq非常适合需要长时间样本收集(如时间序列实验)或大规模细胞图谱项目的异步采样。

这些数据证明,SUM-seq以其卓越的通量、多重分析能力和成本效益,为单细胞多组学研究带来了革命性的突破。

免疫细胞的“变脸”:SUM-seq如何追踪巨噬细胞极化之旅

巨噬细胞 (macrophages) 是先天免疫系统的核心细胞,它们根据微环境信号,能够极化为促炎性的M1状态或抗炎性的M2状态。M1和M2状态在炎症、感染和组织修复中发挥着截然不同的作用。虽然M1和M2极化的关键转录因子已被鉴定,但驱动巨噬细胞极化随时间变化的复杂调控网络仍不完全清楚。SUM-seq的强大功能,使其成为追踪这一复杂生物学过程的理想工具。

研究人员利用SUM-seq分析了人诱导多能干细胞 (human induced pluripotent stem, hiPS) 分化的巨噬细胞,在无刺激的M0状态,以及经脂多糖 (LPS) 和IFN-γ刺激(M1极化)和IL-4刺激(M2极化)后的时间序列中的基因表达和转录因子活性。实验在M0、M1和M2极化的0小时、1小时、6小时、10小时和24小时等五个时间点进行了样本收集,总计18个样本。

高质量数据: 研究人员成功地从一个10x Chromium通道加载了15万个细胞核,获得了51,750个通过质控 (quality control, QC) 过滤的细胞核多组学数据,这些数据在各个样本中分布均匀。平均每个细胞核拥有11,900个独特的ATAC片段,TSS分数达到8,40%的片段位于峰区。在RNA数据中,平均每个细胞核检测到407个UMI和342个基因。尽管在RNA模态中,由于技术原因省略了PEG,导致UMI和基因计数相对较低,但高质量、大数量的细胞核样本依然支撑了有效的下游分析。

清晰的细胞状态分离:UMAP 可视化清晰地揭示了M1和M2极化轨迹上细胞的有效分离,并显示出M1和M2特异性标记基因的表达,印证了实验设置的有效性。

多组学因子分析 (MOFA) 揭示极化关键因子:为了深入剖析影响巨噬细胞M1/M2极化基因表达和染色质可及性的关键特征,研究人员进行了多组学因子分析 (MOFA)。结果令人振奋:

M1极化: 早期响应因子 (Factor 4) 富集了IFN-γ信号和细胞因子信号通路。持续响应因子 (Factor 1) 则与IFN信号、通用免疫系统过程、IL-1信号和代谢相关。晚期响应因子 (Factor 7) 主要与抗原 (cross-) 呈递和RHO信号相关。

M2极化:早期响应因子 (Factor 7) 富集了IL-4信号。两个持续响应因子 (Factor 3和Factor 5) 则与生物氧化 (biological oxidation)、非典型NF-κB信号和Notch信号相关。这表明M2巨噬细胞的代谢发生了转变,Notch信号在M2极化中也发挥着上下文依赖性作用。

转录因子活性动态:通过chromVAR工具,研究人员量化了转录因子基序可及性 (TF motif accessibility),以此作为转录因子结合特定基序 (motif) 的替代指标。他们发现:

M1极化中独特的转录因子动态: 经典的M1转录因子,如STAT1和IRF5的基序活性在M1早期响应中增加,随后NF-κB(NFKB1、NFKB2、RELA、REL和TF65)的活性被激活。AP-1复合体(JUN、FOS等)的基序活性则短暂上调,表明细胞处于激活状态。尤其引人注目的是STAT1的调控转变:STAT1同源二聚体 (STAT1.0) 的活性在初始升高后逐渐下降,而ISGF3复合体 (STAT1.1、STAT2和IRF9) 的活性则持续升高。STAT1.0调节子仅包含8个基因,而ISGF3调节子共享了多达601个基因,这表明了ISGF3在维持M1极化中的关键作用。这突显了STAT1同源二聚体在启动IFN-γ响应诱导的染色质重塑中的作用,随后由ISGF3复合体接管,驱动I型IFN响应。

M2极化中相对平缓的动态:M2极化中转录因子的动态变化相对不那么显著。STAT6的基序活性在M2早期响应中增加,而ETS家族成员(SPIB、ETV3、ETV6)和NFY的基序活性在持续响应中稳定增加。SNAIL和CTCF的基序活性在持续响应中下降,暗示染色质结构发生了全局性重塑。

基因调控网络 (GRN) 与GWAS整合:SUM-seq数据还被用于构建增强子介导的基因调控网络 (eGRN),揭示了转录因子如何驱动染色质重塑,从而激活特定的基因表达程序。研究发现,这些eGRN中的可及染色质区域富集了白细胞计数性状和自身免疫性疾病,如炎症性肠病 (IBD)、溃疡性结肠炎 (UC)、克罗恩病 (CD)、花粉热和多发性硬化症。一个显著的例子是与IBD相关的SNP rs153109,它位于IL-27的内含子区域,而这个峰由NFKB1调控。IL-27是抗原呈递细胞(包括巨噬细胞)产生的重要细胞因子,与IBD的发病机制密切相关。这些发现为连接非编码区遗传变异与目标基因和分子通路提供了强大的框架,有助于我们更深入地理解人类复杂疾病的遗传基础。

精准解析淋巴卫士:SUM-seq洞察T辅助细胞的调控景观

为了验证SUM-seq在原代样本中的应用能力,研究人员将其应用于人CD4+ T细胞研究。CD4+ T细胞根据其微环境中的细胞因子,可以分化为多种不同的T辅助细胞 (T helper, Th) 亚型,每种亚型在免疫反应中扮演着独特角色。

原代细胞的高质量数据: 实验中,研究人员从三名健康献血者外周血单核细胞 (PBMCs) 中分离出初始CD4+ T细胞,并将其分化为Th0、诱导性调节性T细胞 (iTregs)、Th2、Th1、Th17和IFN-β激活的亚型。经过5天分化后,细胞被刺激或非刺激处理,并进行SUM-seq分析。最终,保留了48,153个具有RNA和ATAC信息的细胞核。对于单细胞ATAC模态,平均每个细胞核拥有8,967个独特的片段,TSS分数为8.9。对于单细胞RNA模态,平均每个细胞核检测到1,197个UMI和905个基因。这些指标在各个T细胞亚型和供体之间都具有可比性,表明数据质量稳定。

T细胞亚型特异性标记:SUM-seq数据证实,除了Th1亚型,所有T细胞亚型都表达出与先前研究一致的独特标记基因。进一步扩展Th1基因特征后,其身份也得到了确认。

揭示亚型特异性和刺激响应性转录因子: 研究人员根据转录因子在各T细胞亚型中以及对PMA/离子霉素刺激的响应,将其分为“刺激响应性激活因子”和“T辅助细胞亚型特异性激活因子”。

例如,AP-1复合体成员 (FOS, JUN, BATF family) 在所有T细胞亚型中都显示出刺激后的活性增加,这与其在T细胞激活中的已知作用一致。

同时,研究也观察到许多亚型特异性转录因子:iTreg的TF65、SMAD2/3/4和NR4A1/2;Th2的GATA3;Th1的STAT4;Th17的BATF和MAF;以及IFN-β的STAT1/2和IRF家族。这些转录因子在刺激前后都表现出亚型特异性。

染色质层面分析的重要性:这些发现突出显示了染色质层面分析在阐明T细胞亚型身份和功能调控机制方面的价值。SUM-seq与已知T细胞生物学的吻合,也进一步证明了其在捕获原代人类细胞调控景观方面的可靠性。

基因编辑的“魔术”:SUM-seq揭示iPSC细胞命运的调控秘钥

为了展示SUM-seq强大的多重分析能力,研究人员将其与阵列式CRISPR筛选 (arrayed CRISPR screens) 相结合,通过CRISPR干扰 (CRISPRi) 或CRISPR激活 (CRISPRa) 方式,在人诱导多能干细胞 (hiPSCs) 自发分化过程中,调控关键谱系转录因子(如GATA2、SOX17和NR4A2)的表达。这项实验涵盖了0天、4天、12天和18天等多个时间点,总计54个样本。

大规模筛选与高质数据:研究人员成功地从一个10x Chromium通道加载了约15万个细胞核,分析了56,652个细胞核。这些细胞核平均含有1,402个UMI和982个基因,以及4,497个ATAC片段,平均TSS分数为8.4。尽管自发分化的hiPSCs细胞类型异质性较高,导致样本间差异增大,但SUM-seq依然捕获了高质量的数据。

清晰的谱系分化轨迹:基于文献报道的间充质、内胚层和外胚层命运的基因特征,研究观察到清晰的细胞向特定谱系命运的过渡,并在单层培养中(CRISPRa实验)在第18天出现了明显的分化分叉。GRN分析显示了与特定分化阶段对应的子网络。

CRISPR扰动对细胞命运的影响

GATA2敲低 (GATA2-knockdown, KD):GATA2在促进造血-内皮谱系形成和抑制心肌命运中发挥作用。实验结果显示,GATA2敲低导致侧中胚层基因表达减少,而骨骼肌和肌肉发育相关基因表达增加。在调控层面,GATA2敲低导致GRHL1、TEAD1、GATA和FOX家族的转录因子基序活性增加,而SOX9、SOX10和CTCF的基序活性降低。相反,GATA2过表达 (OE) 则显示出相反的效果,抑制了GRHL1和TEAD1的基序可及性。

NR4A2过表达 (NR4A2-OE): NR4A2在促进神经外胚层命运中发挥作用。实验显示,NR4A2过表达将细胞分化倾向于外胚层样命运,并导致神经元基因表达上调。同时,JUN和FOS等促神经源性转录因子的基序活性增加,而间充质和内胚层相关GATA转录因子活性降低。更令人兴奋的是,NR4A2过表达还促进了OCT4和NANOG等多能性转录因子的基序活性再激活,这可能与神经嵴分化起始阶段的多能性程序重激活有关。

这些实验结果充分证明了SUM-seq结合CRISPRi/a筛选,能够有效剖析转录因子对细胞命运程序的影响,为理解复杂发育生物学过程和疾病机制提供了强大的工具。

SUM-seq开启单细胞多组学研究新纪元

总而言之,SUM-seq作为一项创新的单细胞多组学分析技术,以其前所未有的成本效益、可扩展性和超高通量,超越了现有方法在同时捕获染色质可及性和基因表达方面的表现。它能够生成高质量的数据,并且兼容新鲜和冷冻样本,使其适用于需要多中心或异步采样的研究。

尽管SUM-seq在单细胞基因表达复杂性方面可能略低于某些低通量液滴多组学方法,但其在染色质可及性方面的复杂性与现有平台相当。考虑到其在成本效益、可扩展性和通量方面的巨大优势,SUM-seq在许多研究问题中将是更优的选择。

这项技术已在多个实验设置中得到验证,包括物种混合实验、巨噬细胞极化、原代T细胞分析以及诱导多能干细胞中的阵列式CRISPR筛选。它成功地定义了驱动细胞类型特异性功能和发育过程的核心基因调控网络。当与遗传疾病证据相结合时,SUM-seq为连接非编码区遗传变异与其靶基因和分子通路提供了强大的框架,为深入理解复杂人类疾病的发生机制带来了新的视角。

我们相信,SUM-seq将成为药物筛选、扰动筛选以及大规模细胞图谱项目的重要工具。它将加速解开细胞分化、环境响应和疾病研究中复杂的基因调控网络,为生命科学领域带来革命性的突破。

单细胞多组学研究的浪潮正汹涌而至。SUM-seq的出现,无疑为我们打开了细胞世界的“潘多拉魔盒”,让我们能够以前所未有的深度和广度,去探索生命的奥秘。未来,随着这项技术的进一步发展和应用,我们有望在疾病诊断、治疗和再生医学等领域实现更多激动人心的突破。让我们共同期待,SUM-seq将引领我们走向一个更加清晰、更加精准的细胞生命科学新纪元!

参考文献

Lobato-Moreno S, Yildiz U, Claringbould A, Servaas NH, Vlachou EP, Arnold C, Bauersachs HG, Campos-Fornés V, Kim M, Berest I, Prummel KD, Noh KM, Marttinen M, Zaugg JB. Single-cell ultra-high-throughput multiplexed chromatin and RNA profiling reveals gene regulatory dynamics. Nat Methods. 2025 May 26. doi: 10.1038/s41592-025-02700-8. Epub ahead of print. PMID: 40419657.

声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!

往期热文:

Science | 突破性进展!揭示氯胺酮长效抗抑郁效应的关键“开关”

Science | 揭秘胰腺癌隐形外衣下的“神秘靶点”,免疫治疗迎来新曙光!

Nature | 告别“挨针”?鼻腔疫苗:呼吸道感染的终极防御新策略!

Nature Methods

| 生命蓝图新窗口:二维类胚胎延时培养,首现人类中胚层“乾坤大挪移”全景

Nature Genetics

| 告别“批量”模糊:首个大规模单细胞研究,解码胶质母细胞瘤纵向演变的“个体差异”与“普遍规律”

Nature

| 为什么你能快速上手新事物?原来是纹状体pDMSt帮你搞定了“逐次试验更新”

来源:生物探索一点号1

相关推荐