10点入门:规范使用观察性数据进行描述性流行病学和因果推断研究

360影视 国产动漫 2025-05-28 15:32 2

摘要:老郑今天看到一篇Review article,为卒中研究人员提供了十个需要考量和实施的重要要点,以确保基于观察性数据的描述性流行病学和因果推断研究的有效性和可解释性。与诸位做个分享!

常规收集的健康数据和各种免费开放的公共数据库,为研究人员和临床医生提供了丰富的机会,使其能够通过开展观察性研究来回答重要的科学问题

老郑今天看到一篇Review article,为卒中研究人员提供了十个需要考量和实施的重要要点,以确保基于观察性数据的描述性流行病学和因果推断研究的有效性和可解释性。与诸位做个分享!

文章发表在《European Stroke Journal》杂志,题为:“Conducting descriptive epidemiology and causal inference studies using observational data: A 10-point primer for stroke researchers”。

研究者讨论了观察性研究的不同类型以及此类研究中可能出现的偏倚。

回顾了因果效应的类型,并探讨了如何运用目标试验模拟(Target Trial emulation)和有向无环图(Directed Acyclic Graphs)来提高观察性研究的效度。

阐释了协变量调整在观察性研究分析中的合理与不合理应用

综述了在因果推断研究中评估治疗、干预和暴露效应的多种方法。

最后,为卒中领域及其他领域的临床研究人员和期刊稿件评审人员提供了关于这些方法的合理应用与规范报告的建议。

我们来详细看看!


第一点:考虑您将使用的数据类型

第一点就是要考虑您将使用的数据类型是专门为研究而收集的数据,还是为行政和临床目的(但非特定研究目标)常规收集的健康数据。

虽然随机临床试验(RCT)仍然是指导临床实践的主要证据来源,但临床注册库、电子病历、数据采集系统和数据关联功能的可及性,促使临床医生和研究人员尝试利用常规收集的观察性健康数据来回答研究问题。根据《使用常规收集的观察性健康数据研究报告》(RECORD)声明指南,此类数据定义为“为了行政和临床目的而常规收集的健康数据,未预设特定的研究目标”。

这种做法提高了资源利用效率,但与传统的队列或横断面观察研究(具有前瞻性数据收集)相比,使用常规收集的健康数据开展研究存在关键差异。由于这些数据通常为运营和临床目的而常规收集,因此在应用于临床研究时面临诸多挑战。虽然使用样本估计感兴趣终点并将研究结果推广至目标人群的基本目标不变,但实现该目标的实际步骤——更重要的是,包含或排除某些数据的影响——却有显著不同。

在前瞻性研究中,首先提出研究问题,并定义研究结果适用的人群。接着,规划如何收集研究样本(例如,“我们计划招募所有就诊于特定卒中门诊的患者”)。然后收集相关数据。一旦决定了要收集哪些数据,就要尽量避免出现缺失数据。即使数据完全随机缺失,至多也只是导致假阴性结果(即 II 型错误);如果不幸存在系统性缺失,则会引入偏倚,即使采用复杂的统计方法也不一定能恢复研究的有效性。

而在使用常规收集的健康数据进行研究时,情况则不同。此类数据不可避免地包含与研究问题无关的冗余信息。尤其需要排除那些不属于目标人群的患者数据,否则可能得出误导性结论。例如,常规卒中住院数据包括缺血性卒中、出血性卒中、短暂性脑缺血发作(TIA)和卒中伪像:若研究问题是关于再灌注策略,则在未加筛选的总体上无法可靠回答这一问题。

RECORD 指南是对 STROBE 声明²,³的补充,旨在帮助报告使用常规收集健康数据的观察性研究。在众多 RECORD 建议中,最相关的是那些旨在最大限度减少可能破坏研究结果可推广性的选择偏倚、以及确保合理利用机会性数据的建议。

RECORD 指南提出了如下人群层次结构(见图 1)

源人群(source population):研究者希望研究并将研究结果推广至其上的人群;

数据库人群(database population):源人群的子集,反映了数据源中包含数据的个体;

研究人群(study population):研究者通过编码和算法从数据库人群中识别出的子集。

图1 根据RECORD指南划分的人口层次:源人口为灰色,数据库人口为黄色,研究人口为红色。

请注意,研究人群不一定完全和适当地反映源人群,为了回答研究问题,检查数据库人口是否足以将研究人群推广到预期的源人群是很重要的。

我们可以用国际卒中灌注影像登记(INSPIRE)来说明这一点。


举例

INSPIRE 是一个基于网络的数据存储库,汇集了来自澳大利亚、中国和加拿大综合卒中中心的影像和临床卒中数据,以评估先进影像技术在卒中诊疗中的应用。

自 2012 年起,该登记持续招募急性期行 CT 灌注(CTP)、CT 血管造影(CTA)检查并具有随访影像和临床资料的卒中患者。

Garcia-Esperon 等人利用 INSPIRE 数据评估了基线缺血性核心体积>70ml的患者中,血管内取栓术(EVT)与功能结局之间的关联。其研究人群层次可定义如下:

源人群:缺血性卒中核心体积>70ml的患者;

数据库人群:2012 年至 2020 年 12 月期间,来自澳大利亚、中国和加拿大,发病 24 小时内完成多模态 CT 检查(包括无造影 CT、CT 灌注和 CT 血管造影)的急性缺血性卒中患者,这些患者已被前瞻性纳入 INSPIRE;

研究人群:数据库人群中,最后一次无症状状态<24 小时内完成基线 CTP,核心体积≥70 毫升,且具有 3 个月改良 Rankin 量表(mRS)评分的患者。

若干 RECORD 指南条目专门关注研究人群选择的有效性,并在此提供了有益指导。具体而言:

RECORD 条目 12.1 要求作者“描述研究者访问用于创建研究人群的数据库人群的程度”

RECORD 条目 13.1 指导作者“详细描述纳入研究的人员(即研究人群)选择过程,包括基于数据质量、数据可用性和数据关联的筛选”,可在正文或流程图中呈现;

而 RECORD 条目 19.1 则要求讨论使用非为特定研究问题创建或收集的数据的影响,并就“分类错误偏倚、未测量混杂、缺失数据以及随时间变化的入选标准”等问题进行讨论。


总之,使用常规收集的“机会性”健康数据的研究,在设计和有效性方面与采用前瞻性数据收集的研究具有共同关切,但也易受额外偏倚来源的影响。应根据具体研究问题的性质,采用相应策略来管理这些有效性威胁,如下文各点所述。

建议1.1,在报告使用常规收集健康数据的观察性研究时,应将 RECORD 声明作为对 STROBE 指南的补充

建议 1.2,评估数据库人群是否足以使您的研究人群能够推广至源人群并回答研究问题——也就是说,您的机会性数据集是否具备足够的广度、深度和信息质量,以便构建可靠的分析数据集;若能,是否能够将该分析推广至定义明确的未来患者群体。

第二点:考虑您的研究问题类型

考虑您的研究问题类型是因果关系还是描述性流行病学?

观察性研究的设计选择在很大程度上取决于研究目标和所提出问题的性质。研究目标/问题与研究设计/分析之间的紧密衔接,对研究的有效性至关重要。然而,尽管流行病学文献中对此已有大量高质量讨论,但卒中领域发表的观察性研究中,很少有人将这些概念明确阐述。

要从观察性研究中获得有效结果,必须区分描述性、因果性和预测性流行病学研究问题。但预测性流行病学问题超出本讨论范围,这里我们聚焦于描述性和因果性研究问题。

举个例子。经过数年新冠疫情,我们想知道:个体所经历的新冠感染次数和严重程度,是否与其在某一限定时间内发生卒中的风险相关?由此可衍生两个截然不同的研究问题,对应不同的研究目标

描述性/关联研究问题:那些经历过多次严重新冠感染的人,在给定时间内发生卒中事件的风险是否更高?

因果推断研究问题:经历多次严重新冠感染是否会提高个体在给定时间内发生卒中事件的风险?

描述性/关联研究通常关注“疾病与年龄、性别、种族、职业、社会阶层和地理位置等基本特征之间的关系”。这类研究旨在“描述在明确定义人群中,健康状况、疾病及有害或有益暴露的现状分布,包括任何有意义的分布差异及其随时间的变化”。

描述性问题聚焦于在人群实际暴露条件下,结果在特定人群中的分布;

图 2(a)针对描述性流行病学问题进行“观察”比较。要回答描述性流行病学问题,需要将未暴露者(蓝色)和已暴露者(黄色)按其实际观察到的状态进行比较。

而与之不同的因果推断问题则要求考虑一个假设的替代方案(在统计学文献中称为“反事实”)场景,即探究如果那些实际上未经历多次严重新冠感染的人群,假如暴露于此,卒中风险是否会有所不同。

图 2(b)因果推断问题的反事实比较。要回答因果推断问题,需要在反事实情景下比较未暴露者(蓝色)和已暴露者(黄色):首先假设所有参与者均为未暴露(蓝色),然后假设所有参与者均为已暴露(黄色)。

为什么这两个问题在根本上如此不同?

主要原因在于它们需要不同的答案和不同的分析

即便那些经历过多次严重新冠感染的人实际上没有感染新冠,他们发生卒中的风险也可能更高。例如,这可能是因为他们本身就具有更多的常见卒中风险因素,其中一些也使其更易感染新冠。也许我们已经观察到,暴露于多次严重新冠感染者与未暴露者之间的卒中风险存在差异。

这个答案作为对“所见即所得”的描述或许完全足够;但作为衡量新冠暴露对卒中因果效应的指标,却完全不足,因为它存在偏倚或混杂——它无法支持我们对反事实情景(即如果未暴露者变为暴露者会发生什么)进行推理。

总而言之,描述性流行病学/关联问题关注的是在实际暴露条件下的研究对象,而因果推断问题则关注在反事实暴露条件下估计感兴趣的结局,即那些并未真实观察到的情境。

提出因果推断问题“经历多次严重新冠感染是否会在特定时间内增加卒中风险”时,研究者希望了解该暴露(多次严重新冠感染)如何改变给定人群的结局(卒中事件)。这一问题并不假定研究人群确实同时在暴露和非暴露条件下被观察到。

事实上,在非随机的观察性研究中,已有暴露亚组和未暴露亚组几乎必然是不同的两群体。对此将在第 3 点中进一步讨论。

建议 2.1,在手稿中,基于常规收集的观察性数据提出的研究目标和研究问题究竟是描述性流行病学还是因果推断,需谨慎考虑并明确定义。研究设计的适当性、所选分析方法以及由此得出的结论的有效性,只有在明确目标的语境下才能得到确立。

建议 2.2,手稿中使用的术语需反映研究目标和问题的性质,并与相应的研究设计和分析相匹配。诸如“A 影响 B”或“A 作用于 B”之类的因果关系术语,应仅限于第 3 点讨论的因果推断研究;“预测”一词应仅用于预测性研究。对描述性/关联研究而言,更合适的表述是“A 与 B 相关”。


这篇文章实在太长,今天我们先分享前两点,感兴趣的朋友可以持续关注本公众号,我们将陆续分享整篇文章!

参考文献:

Churilov L, Hayward K, Yogendrakumar V, Andrew N. Conducting descriptive epidemiology and causal inference studies using observational data: A 10-point primer for stroke researchers. . 2025;0(0). doi:10.1177/23969873251332118

来源:郑老师讲统计

相关推荐