摘要:大脑是最复杂的器官之一,其功能的调控深受基因和环境的影响。然而,疾病如何影响基因表达,基因表达又如何与大脑疾病的发生发展相关,至今仍是神经科学领域的核心问题。传统的基因组研究往往基于整块脑组织,忽视了不同细胞类型在疾病中的独特角色,这种“整体视角”可能掩盖了细
引言
大脑是最复杂的器官之一,其功能的调控深受基因和环境的影响。然而,疾病如何影响基因表达,基因表达又如何与大脑疾病的发生发展相关,至今仍是神经科学领域的核心问题。传统的基因组研究往往基于整块脑组织,忽视了不同细胞类型在疾病中的独特角色,这种“整体视角”可能掩盖了细胞特异性基因表达的细微变化和关键机制。1月10日Nature Genetics的研究报道“Cell state-dependent allelic effects and contextual Mendelian randomization analysis for human brain phenotypes”,研究人员首次从单细胞层面对基因调控与脑疾病的关联进行了深入剖析,试图揭示疾病背景下基因表达的动态变化及其对脑部健康的影响。
该研究通过对391名捐献者(包括208名脑病患者和183名健康对照者)的脑组织样本进行单核RNA测序(snRNA-seq),共检测了234万余个细胞的基因表达特征,发现了与基因变异相关的13,939个基因表达调控位点(eQTLs)。研究揭示了这些基因调控作用在不同疾病状态和细胞类型中的显著差异性。例如,有些基因在阿尔茨海默病(AD)或帕金森病(PD)患者的特定细胞类型中表达显著变化,这种“疾病依赖性基因效应”为理解脑疾病的致病机制提供了新的线索。此外,该研究进一步采用孟德尔随机化分析(Mendelian Randomization, MR),在未受疾病影响的健康大脑样本中,确定了140个可能与脑疾病相关的因果性基因,为未来药物靶点开发和诊断标志物研究奠定了基础。
该研究不仅提出了更精准解读基因变异与脑疾病关联的策略,还为探索大脑疾病的早期干预和精准治疗提供了启发。通过将单细胞技术与遗传学分析相结合,研究人员正在逐步揭开基因、细胞与疾病之间的复杂网络,助力破解脑疾病这一医学难题。
大脑疾病研究的现状:从整体视角到单细胞解析的转变大脑是最复杂的器官,其结构与功能的异常直接导致多种神经系统疾病,如阿尔茨海默病(Alzheimer's Disease, AD)、帕金森病(Parkinson's Disease, PD)以及多发性硬化(Multiple Sclerosis, MS)。长期以来,研究人员致力于探索这些疾病的遗传基础。然而,传统方法多基于“整体组织”层面的分析,这种视角虽然揭示了一些重要的基因和通路,却无法反映不同细胞类型在疾病发生中的特异性作用。例如,神经元与小胶质细胞在阿尔茨海默病中可能扮演截然不同的角色,但整体组织分析会将这些信号“稀释”,无法精确定位关键的致病机制。
近年来,单细胞RNA测序(scRNA-seq)技术的兴起为这一难题提供了全新解决方案。通过解析单个细胞的基因表达,研究人员得以捕捉不同细胞类型的独特基因调控模式,为理解大脑疾病提供了前所未有的细腻视角。该研究正是基于这一技术,从391名捐献者的脑组织样本中,分析了超过234万个单细胞的基因表达,为破解疾病背后的遗传机制打开了新的大门。
基因调控的关键作用:eQTL(表达数量性状位点)的重要性基因调控是决定细胞功能的核心,而eQTL(表达数量性状位点)是揭示基因调控的重要工具。eQTL指的是单核苷酸多态性(SNP)与基因表达水平之间的关联,它能够帮助研究人员定位哪些基因受到遗传变异的影响。在大脑疾病中,eQTL的作用尤为突出,因为这些遗传变异往往通过影响特定基因的表达,进而改变大脑的结构和功能。
该研究中,通过分析八种大脑细胞类型(包括兴奋性神经元、抑制性神经元、小胶质细胞和星形胶质细胞等),研究人员发现了13,939个eQTL位点,并进一步证明了这些位点中16.7%至40.8%存在疾病依赖性效应。换句话说,这些位点的调控作用在特定疾病状态下会发生显著变化。这样的发现不仅凸显了eQTL在揭示基因调控与疾病关联中的重要性,也进一步表明,仅依赖整体组织数据可能导致对病因机制的误判。
为什么需要健康大脑样本?:疾病样本中反向因果关联的挑战尽管分析疾病样本能够提供重要线索,但疾病状态本身会对基因表达产生深远影响。这种影响可能掩盖真正的因果关系,甚至导致“反向因果”的错觉。例如,阿尔茨海默病患者大脑中某些基因的表达可能是疾病的结果,而非致病原因。这种现象使得通过分析疾病样本来识别因果基因充满挑战。
为了克服这一问题,该研究引入了183例完全健康、无脑疾病病史的对照样本,这些样本在死亡后经神经病理学检查证实为正常。这一策略的独特性在于,通过排除疾病干扰,研究人员能够更精准地捕捉基因与脑功能的真实关联。例如,在健康样本中,研究人员发现了91个在混合数据集中无法检测到的eQTL位点,为探索因果性基因提供了宝贵的资源。
该研究以391名捐献者的大脑组织为基础,其中包括208名有神经系统疾病病史的患者和183名完全健康的对照样本。所有样本均经过严格的神经病理学检查,以确保数据的准确性和可靠性。
研究团队对这些样本进行了单核RNA测序(snRNA-seq)分析,共获取了234万多个单细胞的基因表达数据。这一庞大的数据集包含了从神经元到非神经元细胞的多种细胞类型,其独特性在于能将基因表达的变化精确定位到具体细胞类型中。此外,研究使用了严格的质量控制方法,包括去除低质量细胞、标准化数据和细胞类型注释,从而确保分析结果的可靠性。
研究设计与eQTL分析(Credit:Nature Genetics)
a. 研究设计的概述(Overview of study workflow)
样本收集与测序:从391名捐献者中获取脑组织样本,包括208名患有神经系统疾病的患者(如阿尔茨海默病、帕金森病)和183名健康对照者。对这些样本进行了单核RNA测序(snRNA-seq),涵盖多种脑细胞类型。
eQTL分析:通过基因型和基因表达数据的结合,识别每种细胞类型的cis-eQTL(表达数量性状位点),以揭示遗传变异如何调控基因表达。
数据验证与整合:通过MetaBrain(人类脑组织RNA测序数据集)验证单细胞cis-eQTL,并将结果与伪散装组织(pseudobulk)数据进行比较,分析单细胞数据的独特性和优势。
b. 每种细胞类型的总eGenes与特异性eGenes总eGenes数量(深色柱状图):兴奋性神经元(excitatory neurons)和星形胶质细胞(astrocytes)拥有最多的eGenes,分别超过5,000和4,000个,而小胶质细胞和少突胶质细胞的总eGenes数量相对较少。
细胞类型特异性eGenes(浅色柱状图):某些细胞类型(如小胶质细胞)具有较高比例的特异性eGenes,表明其基因调控具有较强的细胞类型依赖性。
c. 单细胞cis-eQTL的验证(与MetaBrain数据的对比)研究将单细胞cis-eQTL结果与MetaBrain数据进行验证,以评估重复性(replication)和方向一致性(directionality):
重复性(x轴):反映了在MetaBrain中能够检测到的单细胞cis-eQTL比例,不同细胞类型的重复性差异显著。
方向一致性(y轴):指相同cis-eQTL在MetaBrain中的调控方向是否与单细胞数据一致(例如,正相关或负相关)。
d. 单细胞eGenes与pseudobulk eGenes的重叠通过将单细胞数据的基因表达计数聚合,模拟出pseudobulk数据,研究比较了单细胞eGenes与pseudobulk eGenes的重叠:
单细胞特异性:许多eGenes仅在单细胞分析中可检测到,这种特异性在小胶质细胞和星形胶质细胞中尤为显著。
重叠部分:尽管单细胞分析能够捕获更多特异性信号,但部分eGenes在单细胞与pseudobulk数据中均可检测到,表明pseudobulk分析对某些常见调控信号仍有一定捕获能力。
这一比较强调了单细胞分析在解析细胞特异性调控网络中的独特价值,同时也表明pseudobulk组织分析在某些场景下的补充作用。
细胞类型的多样性:从兴奋性神经元到少突胶质细胞大脑由多种类型的细胞组成,各自扮演着不可或缺的角色。该研究覆盖了八种主要的细胞类型,包括兴奋性神经元、抑制性神经元、星形胶质细胞、小胶质细胞、少突胶质细胞(Oligodendrocytes)、少突胶质前体细胞(OPCs)、内皮细胞和周细胞(Pericytes)。这种细胞类型的多样性使得研究能够捕捉到不同细胞在基因调控上的差异性。
例如,兴奋性神经元和抑制性神经元分别在大脑信号传递中发挥着激发和抑制作用,而星形胶质细胞则负责提供能量支持和维持神经元的功能环境。此外,小胶质细胞作为大脑的“免疫卫士”,在神经炎症和疾病过程中具有关键作用。通过对这些细胞类型的单独分析,研究发现,不同细胞类型中的基因调控模式具有显著差异,这种差异为理解大脑疾病的多维机制提供了重要线索。
亮点:从500万SNP到13,939个基因调控位点的发现该研究使用了超过500万个单核苷酸多态性(SNP)位点的数据,以探索基因调控与表达水平之间的关联。在八种细胞类型中,研究共发现了13,939个基因调控位点(eQTL),涵盖了30,027个eGenes(调控基因)。其中,约39%的基因仅在一种细胞类型中展示出调控作用,这进一步说明了单细胞解析的必要性。
研究还发现,eQTL的分布与基因转录起始位点(TSS)呈显著富集关系,特别是在小胶质细胞和星形胶质细胞中,这种富集现象尤为明显。此外,通过与大规模的脑皮层组织数据进行比较,单细胞数据额外识别出了4,898个新的eGenes,显示了单细胞技术在解析复杂基因调控关系中的独特优势。
值得注意的是,这些发现并不仅仅依赖于庞大的样本量。研究团队应用了线性混合效应模型(Linear Mixed Effects Model),在剔除疾病状态和其他临床变量的干扰后,确保了基因表达与调控关系的真实可靠性。例如,某些与神经退行性疾病密切相关的基因,仅在特定细胞类型中展现了调控作用,这为进一步探索疾病机制和靶向治疗提供了关键依据。
疾病如何改变基因调控?
疾病依赖性基因效应的揭示:阿尔茨海默病、帕金森病和多发性硬化的例子
基因表达的调控不仅由遗传因素决定,还深受疾病状态的影响。该研究发现,不同大脑疾病对基因调控的影响存在显著的细胞特异性。例如,研究识别出高达40.8%的表达数量性状位点(eQTLs)在疾病状态下表现出显著的疾病依赖性效应。这意味着,同一基因的调控作用可能因患者是否患有某种疾病而截然不同。
以阿尔茨海默病(Alzheimer’s Disease, AD)为例,rs117934759这一单核苷酸多态性(SNP)在小胶质细胞中调控PTPN12基因的表达。在健康样本中,PTPN12的表达较为平稳,但在AD患者中,其调控效应显著增强(P值=1.11×10⁻¹⁰)。类似地,在帕金森病(Parkinson’s Disease, PD)和多发性硬化(Multiple Sclerosis, MS)中,也观察到了独特的疾病依赖性调控模式。例如,rs7932358位点在少突胶质细胞中调控ARHGAP20基因的表达,在PD和MS患者中均表现出显著的调控增强效应。这些发现表明,大脑疾病不仅改变了基因的表达水平,还显著改变了遗传变异对基因表达的调控方式。
细胞类型与疾病的特殊关系:小胶质细胞在阿尔茨海默病中的重要性
不同细胞类型在疾病中的作用各不相同,其中小胶质细胞的特殊性尤为突出。该研究显示,小胶质细胞在阿尔茨海默病的遗传调控中扮演着核心角色。具体而言,与AD相关的BIN1、RASGEF1C和PICALM基因的调控作用在小胶质细胞中表现尤为强烈。这些基因在健康样本中的调控作用相对较弱,但在AD样本中,其eQTL效应显著增强,甚至对疾病风险的贡献超过了其他细胞类型。
小胶质细胞的这种“敏感性”可能与其作为大脑免疫系统核心的角色有关。在AD患者中,小胶质细胞的基因调控不仅涉及炎症反应,还可能直接影响神经元的生存和功能。例如,BIN1基因的表达调控增强被认为与淀粉样蛋白病理的加速累积密切相关。这种发现强调了深入研究特定细胞类型在疾病中的遗传调控作用的重要性,为未来靶向小胶质细胞的精准治疗提供了理论依据。
数据背后的意义:疾病样本调整仍不足以消除偏差
传统上,研究中常采用混合疾病和健康样本的方式,通过统计方法对疾病状态进行调整。然而,该研究发现,这种方法难以完全消除疾病对基因调控的深远影响。例如,某些疾病依赖性调控效应在混合数据中会被显著削弱甚至掩盖。以rs60935857位点调控ZNF880基因为例,在兴奋性神经元中,其调控效应在帕金森病和对照组中有显著差异(P值分别为2.24×10⁻⁶和2.60×10⁻¹⁵)。即使调整了疾病状态,这种差异依然显著,说明疾病本身已深刻影响了基因调控的动态过程。
这些发现凸显了健康样本在研究中的重要性。通过分析183个无神经系统疾病病史的健康样本,研究团队能够更精准地揭示基因与疾病之间的因果关系。
健康样本的独特价值:183个健康样本中的91个新发现在研究基因与疾病的因果关系时,健康样本提供了独特的优势。该研究通过183个无神经系统疾病病史、经神经病理学检查证实健康的大脑样本,揭示了疾病状态对基因调控的干扰作用,并发现了91个此前未在混合样本中检测到的新的基因调控位点(eQTLs)。这些新增发现强调了排除疾病状态干扰的必要性。
例如,PEX13基因在兴奋性神经元中调控的重要性,只有在健康样本中得到明确体现。在混合数据集中,其共定位信号(colocalization signal)较弱(PP.H4=0.08),但在健康样本中显著增强至PP.H4=0.87。这种显著差异表明,疾病状态可能掩盖了关键因果基因的作用,而健康样本的分析有助于揭示这些被疾病状态“隐藏”的因果关系。
因果基因的识别:140个基因-性状关联的验证通过健康样本,研究团队采用孟德尔随机化(Mendelian Randomization, MR)方法,验证了140个基因-性状关联,为探索复杂疾病的遗传机制提供了坚实的科学依据。这些因果基因与26种中枢神经系统(CNS)性状存在显著关联,包括阿尔茨海默病(AD)、帕金森病(PD)和智力水平等。
值得注意的是,这些因果关联不仅限于单一细胞类型。例如,EGFR基因在星形胶质细胞中的表达与阿尔茨海默病风险显著相关(MR P值=2.35×10⁻⁹),其效应方向表明基因表达的增加会提高疾病风险。此外,研究发现大多数基因-性状关联(81.9%)仅在特定细胞类型中显现,而13个基因在多种性状中具有广泛关联,提示这些基因可能在多种疾病或性状中扮演关键角色。
EGFR基因在阿尔茨海默病中的双重角色EGFR(表皮生长因子受体)基因是该研究的一个亮点案例,其在阿尔茨海默病中的双重角色引发了广泛关注。MR分析表明,EGFR基因表达的增加显著提高了AD的发病风险(效应值β=0.14)。这项发现与已有研究一致,支持了EGFR可能通过炎症或细胞增殖途径加剧AD病理的观点。
更为重要的是,EGFR的作用并不仅限于AD。在星形胶质细胞中,其基因调控也可能影响其他神经系统性状,例如认知能力和大脑体积的变化。这种跨性状的影响提示,EGFR可能是一个潜在的治疗靶点。此外,由于EGFR信号的增强在健康样本中表现得尤为明显,这也表明靶向EGFR的治疗可能具有疾病预防和干预的潜力。
健康与疾病样本的互补作用:从病理学到预防医学传统的疾病研究主要聚焦于病理样本,以探讨疾病状态下的基因调控变化。然而,疾病样本的基因表达往往受到病理过程的深远影响,这种复杂性可能掩盖真正的致病机制。该研究通过结合健康与疾病样本的互补分析,不仅揭示了疾病状态下的特异性变化,还为预防医学提供了新的视角。
例如,在健康样本中,研究发现了一些潜在的保护性基因调控模式,这些基因可能在疾病早期阶段发挥关键作用。以阿尔茨海默病(AD)为例,某些基因在健康小胶质细胞中的调控效应与疾病风险呈负相关,这提示这些基因可能有助于延缓病理进程。通过深入研究这些基因及其调控网络,研究人员有望开发出更有效的早期干预策略,从而推动从病理学到预防医学的转变。
多维度整合的潜力:单细胞与大规模数据结合的优势单细胞RNA测序(scRNA-seq)技术为揭示细胞特异性基因调控提供了前所未有的分辨率,但其样本规模相对较小,可能限制了某些稀有效应的发现。该研究通过将单细胞数据与大规模基因组关联研究(GWAS)和体细胞全基因组测序(WGS)数据相结合,充分挖掘了多维数据的潜力。
这种整合的优势在于,它能够将GWAS中识别的疾病相关位点与单细胞数据中的特定细胞类型关联起来。例如,研究将GWAS数据中的AD风险位点与小胶质细胞特异性基因调控效应相结合,成功识别了与炎症调控相关的多个新靶点。这种策略不仅提高了研究的统计效能,还显著拓展了单细胞技术的应用范围,使得稀有变异和细胞特异性效应的研究成为可能。
此外,通过整合不同数据类型,研究能够更全面地理解基因、环境和细胞微环境之间的复杂相互作用。例如,该研究发现,星形胶质细胞中的特定调控网络可能通过与环境因素(如代谢应激)的交互,影响阿尔茨海默病的发病风险。这种发现为多维度数据整合的研究框架提供了范例。
应用前景:药物靶点开发与生物标志物识别该研究的结果为药物靶点的开发和生物标志物的识别提供了重要参考。例如,EGFR基因的发现不仅明确了其在阿尔茨海默病中的关键作用,还提示了靶向EGFR的药物可能具有多种适应症潜力。此外,研究中识别的140个因果基因和数千个特定细胞类型的eQTLs,为未来的药物开发提供了丰富的候选分子。
在生物标志物方面,健康样本中发现的保护性基因调控模式有望用于疾病的早期诊断和风险预测。例如,小胶质细胞中与阿尔茨海默病风险负相关的基因可作为潜在的血清或脑脊液标志物,用于识别高危人群或监测治疗效果。这种从基因调控网络到临床应用的转化研究,将为精准医学的发展提供强有力的支持。
从细胞层面精细剖析遗传调控网络到全面探索疾病机制,该研究为神经科学领域开创了新篇章。单细胞技术的引入,不仅让我们看得更清、更深,也为攻克复杂的大脑疾病带来了新的希望。
参考文献
Haglund, A., Zuber, V., Abouzeid, M. et al. Cell state-dependent allelic effects and contextual Mendelian randomization analysis for human brain phenotypes. Nat Genet (2025). https://doi.org/10.1038/s41588-024-02050-9
责编|探索君
排版|探索君
转载请注明来源于【生物探索】
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
来源:生物探索