Nat Genet | 精准定位疾病关联基因和细胞类型的新方法——TGFM

360影视 2025-01-27 01:40 2

摘要:复杂疾病,如糖尿病、心脏病和癌症,往往涉及多个组织和细胞类型,其机制复杂且异质【1】。传统的全基因组关联研究(GWAS) 和表达量性状关联研究(eQTL) 方法主要关注单个基因或组织的效应,难以解析这种多组织机制,导致对疾病因果基因和组织的理解有限【2-5】。

撰文 | 格格

复杂疾病,如糖尿病、心脏病和癌症,往往涉及多个组织和细胞类型,其机制复杂且异质【1】。传统的全基因组关联研究(GWAS) 和表达量性状关联研究(eQTL) 方法主要关注单个基因或组织的效应,难以解析这种多组织机制,导致对疾病因果基因和组织的理解有限【2-5】。例如,一个GWAS发现的关联基因可能在分析的组织中并非因果基因,因为它可能在其他组织中发挥因果作用。同样,一个eQTL也可能存在不确定性,例如,其效应可能受到其他基因或环境因素的影响。

现有方法通过整合GWAS数据和eQTL数据来推断疾病关联基因,但存在局限性。例如,疾病关联基因可能在分析的组织中并非因果基因,因为疾病可能在其他组织中发挥作用。不仅如此,现有的基因精细定位方法主要关注单个组织中基因的因果效应,但忽略了基因与组织的协同作用,无法全面解析疾病关联基因在不同组织中的因果效应。此外,cis表达预测模型可能存在不确定性,导致结果不准确。因此,需要一种能够同时考虑基因与组织协同作用,并准确预测cis表达效应的方法,以精准定位疾病关联基因和组织,并解析多组织机制。

近日,来自美国哈佛大学公共卫生学院流行病学系的Alkes L. Price和Benjamin J. Strober研究团队合作在Nature Genetics杂志发表题为Fine-mapping causal tissues and genes at disease-associated loci的研究论文,该研究开发并验证一种名为组织-基因精细定位(TGFM)的新方法,用于解析复杂疾病中基因与组织的协同作用,并精准定位疾病关联基因和组织。

研究人员开发了TGFM方法,该方法可用于推断每个基因-组织对在疾病关联位点上的后验包含概率 (PIP) ,并识别潜在的因果基因-组织对。研究人员首先对TGFM方法进行了全面的评估,并与coloc、FOCUS和cTWAS等现有的精细映射方法进行了比较。评估主要集中在两个关键方面:校准和功效。校准评估了TGFM方法识别的因果基因-组织对的准确性。研究发现,TGFM在所有eQTL样本大小和PIP阈值下都能产生良好校准的PIP,而其他方法在校准方面表现较差。这表明TGFM能够更准确地识别因果基因-组织对,避免将非因果基因-组织对误认为是因果的。功效评估了TGFM 方法检测因果基因-组织对的能力。研究发现,TGFM在检测因果基因-组织对方面具有中等程度的功效,而其他方法在功效方面表现更高。然而,这些方法在校准方面的缺陷意味着它们可能会将许多非因果基因-组织对误认为是因果的。

研究人员将TGFM方法应用于45种来自UK Biobank的疾病和复杂性状,并使用38个 GTEx 组织的基因表达数据进行了分析。结果发现,TGFM 识别了711个基因-组织-性状三元组,2800个基因-性状对 (将基因-组织PIP在组织中汇总) ,以及5893个非介导遗传变异-性状对,其PIP大于0.5。这表明疾病相关位点上的因果基因-组织对数量庞大,并且这些对在解释疾病中起着重要作用。此外,TGFM方法识别的因果基因-组织对主要集中在已知的关键疾病组织中,例如肝脏、动脉、脾脏和淋巴组织。这表明这些组织在疾病的发病机制中起着核心作用,并且TGFM能够准确地识别这些组织。另外,因果基因-组织对在已知疾病相关基因中显著富集,例如PoPS分数高的基因和与疾病遗传力相关的基因集。这表明TGFM能够识别与疾病相关的基因,并为研究疾病机制提供新的线索。

研究人员进一步使用TGFM方法分析了来自外周血单核细胞 (PBMC) 的九种单细胞eQTL 数据,并与GTEx组织数据联合分析。结果发现,TGFM识别了30个基因-单细胞PBMC细胞类型-性状三元组,其中25个涉及与自身免疫疾病和血液细胞性状相关的组织。这表明单细胞eQTL数据可以提供有关疾病因果机制的新见解,并为研究疾病机制提供新的线索。

另外,识别的因果基因-单细胞 PBMC 细胞类型对主要集中在预期的性状关键PBMC细胞类型中,例如非经典单核细胞和经典单核细胞。这表明这些细胞类型在疾病的发病机制中起着重要作用,并且 TGFM 能够准确地识别这些细胞类型。

总之,该研究提出了一种名为TGFM的新型方法,用于精确定位疾病相关位点上起作用的因果基因和组织。该方法综合考虑了基因-组织对和非介导变异的影响,并通过模拟预测基因表达的不确定性,避免了传统方法的局限性。TGFM在分析UK Biobank数据和单细胞 eQTL数据时,成功识别了大量因果基因-组织对,并揭示了新的生物学机制,为理解复杂疾病的组织特异性和基因调控提供了新的视角。

制版人:十一

参考文献

1. Hekselman, I. & Yeger-Lotem, E. Mechanisms of tissue and cell-type specificity in heritable traits and diseases.Nat. Rev. Genet.21, 137–150 (2020).

2. Nasser, J. et al. Genome-wide enhancer maps link risk variants to disease genes.Nature593, 238–243 (2021).

3. Boix, C. A., James, B. T., Park, Y. P., Meuleman, W. & Kellis, M. Regulatory genomic circuitry of human disease loci by integrative epigenomics.Nature590, 300–307 (2021).

4. Gamazon, E. R. et al. A gene-based association method for mapping traits using reference transcriptome data.Nat. Genet.47, 1091–1098 (2015).

5. Hormozdiari, F. et al. Colocalization of GWAS and eQTL signals detects target genes.Am. J. Hum. Genet.99, 1245–1260 (2016).

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

来源:黄鼠狼论科学

相关推荐