摘要:在上一期,我们已经讲完了生存分析,这期开始讲诊断试验,我们首先来理清诊断试验的基础知识,主要从诊断试验的基本概念、诊断试验与筛检试验的区别、诊断试验的应用原则、诊断试验的临床应用价值、各种诊断试验的统计分析方法原理、诊断试验真实性的评价指标、提高诊断试验效率的
作者/风仕
在上一期,我们已经讲完了生存分析,这期开始讲诊断试验,我们首先来理清诊断试验的基础知识,主要从诊断试验的基本概念、诊断试验与筛检试验的区别、诊断试验的应用原则、诊断试验的临床应用价值、各种诊断试验的统计分析方法原理、诊断试验真实性的评价指标、提高诊断试验效率的方法及诊断试验评价中常见的偏倚这几方面进行讲解。
诊断试验基本概念
1.诊断(diagnosis)是指在临床上医务人员通过详尽的检查及调查等方法收集各种信息,经过整理加工后对病人病情的基本认识和判断。据此制定下一步的治疗或干预方案,完成救治任务。
2.诊断性试验(diagnostic test)是指运用临床资料、实验室检查、影像学检查等手段,对疾病做出诊断的试验。准确及时的诊断是有效治疗的前提,因此需要全面评价诊断性试验正确区分某种特定疾病的患者和非患者的能力,常用评价指标主要包括三个方面:真实性、可靠性和收益。
3.诊断性试验准确性(diagnostic test accuracy,DTA)研究是评估一种或多种诊断性试验区分受试者“有病”或“无病”的研究,其结果可以为临床决策提供有力参考。
4.ROC曲线:ROC曲线是受试者工作特征(receiver operating characteristics)的缩写,对诊断方法的准确性评价,欲知一种检测方法的准确性,则一定需要一个可以信赖的标准(金标准),如同要判定一个考生的考试成绩,就需要知道其考卷的标准答案一样。 在临床实践中,金标准可能费时费力,所以试图寻找一个可以替代的检测方法,这就是ROC曲线的应用。ROC曲线要求资料为连续变量或等级变量,以金标准为分组依据,图示灵敏度和特异度来探讨该方法的准确性。同时也可以探讨多种替代方法之间的优劣,所采用的软件为SPSS。
5.Bland-Altman图:很多情况下,需要探讨两种检测方法的一致性,如果两种检测方法的一致性较好,那么则可以相互替代,此时最常用到Bland-Altman图,所釆用的软件为GraphPad Prism。
诊断试验与筛检试验的区别
1.目的:
筛检试验:用以区别可疑病人与可能无病者。诊断试验:用来区别病人与可疑有病但实际无病的人。
2.对象:
筛检试验:健康或表面健康的人。诊断试验:病人或可疑病人。
3.要求:
筛检试验:快速、简便,有高灵敏度,尽可能发现所有可能的病人。诊断试验:较高的准确性、特异度和灵要求敏度,尽可能诊断出所有病人和排除所有非病人。
4.费用:
筛检试验:简单、廉价的方法。诊断试验:一般价格较高。
5.处理:
筛检试验:阳性者须进一步作诊断试验以确诊。诊断试验:阳性者需要进一步观察和及时处理。
诊断试验使用条件
1.确定金标准:金标准是指当前医学界公认的、对某疾病最可靠的诊断方法。这可以包括病理学检查、实验室检查、影像学检查、术中发现以及专家或权威机构认定的综合诊断标准等。选择公认的最新的参考标准对诊断试验研究至关重要。
2.选择研究对象:研究对象应分为两组:病例组和非病例组。病例组应由金标准确诊的有病的患者组成,包括各种类型和病情的患者。非病例组应由金标准证实没有患目标疾病的无病患者组成。此外,最好是容易与该病相混淆的其他疾病患者。
3.估计样本量:根据估计的总体率样本含量的方法,分别计算病人组及非病人组的样本含量。所需已知条件包括诊断试验的灵敏度和特异度以及允许误差。
4.盲法判断和比较试验结果:将研究对象用两种诊断方法进行同步、盲法判定。最后将资料收集整理后进行分析。
5.评价指标的统计分析和结果报告:评价指标包括灵敏度、特异度、精确度、召回率等。通过统计分析这些指标,并对结果进行详细报告,以评估诊断试验的性能。
这些条件确保了诊断试验的有效性和可靠性,使其能够在临床实践中提供准确的诊断依据。
诊断试验的应用原则
诊断是临床采取有效治疗措施的前提,因此诊断试验必须能正确判断病人和非病人,还要为受检者所接受,所以诊断试验要求:
1.灵敏度、特异度要高。
2.快速、简单、价廉、容易进行。
3.安全、可靠、尽量减少病人的损伤和痛苦。
诊断试验的临床应用价值
1.诊断试验的灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)越高,诊断试验的准确性越高。
2.诊断试验的阳性似然比(LR+)越高,诊断试验的准确性越高。
3.诊断试验的阴性似然比(LR-)越低,诊断试验的准确性越高。
4.如果一项试验的敏感度和阳性似然比非常高(比如,LR+>20),则阴性试验的结果有充分的理由排除该疾病,可以记住一句范式“SnNout”。
5.如果一项试验的特异度和阴性似然比非常高(比如,LR-
各种诊断试验的统计分析方法原理
1.准确性检验(ROC曲线):(1)ROC曲线的绘制原理:若检测结果为定量资料或等级资料,当选择不同检测值作为判断阳性、阴性结果的阈值时 可以分别计算出相对应的特异度和灵敏度,以(1 -特异度)为横轴,灵敏度为纵轴,将坐标轴 以(1 -特异度,灵敏度)的数据点描绘于平面直角坐标系,将各点连接起来的曲线则为ROC 曲线。(2)ROC曲线的含义:①单条ROC曲线的解释:一个优良的诊断试验其ROC曲线应当从左下角垂直上升至顶 线,然后水平方向向右延伸到右上角。如果ROC曲线沿着对角线方向分布,表示分类是机遇 造成的,正确分类和错分的概率各为50% ,此时该诊断方法完全无效。②两条ROC曲线的解释:如果有两种新方法同时测量各标本,则绘制两条ROC曲线。如 果两条曲线不交叉,那么可以比较两个实验的优劣:更外面的、离对角线更远的曲线,其灵敏度和特异度均高于里面的、离对角线更近的曲线。
ROC曲线下面积取值范围为0.5 ~ 1.0,一般来说,ROC曲线下面积在0.5〜0.7之间表示诊断价值较低,在0.7〜0.9之间表示诊断价值中等,0.9以上表示诊断价值较高。
2.一致性检验(Bland-Altman图):Bland-Altman分析用于评价测量结果为连续性资料的两种方法一致性,最初由Bland JM 和Altman DG于1986年提出,其基本思想是计算两种测量结果的一致性界限(limit of agreement),并用图形的方法直观反映一致性界限,最后结合临床实际,得出两种测量方法是否具有一致性的结论。
偏倚(bias)当用两种方法对同一批受试对象同时进行测定时,通常不会获得完全一致的结果,而是存在一定差异,如一种方法的测量结果经常大于(或小于)另一种方法的结果, 这种差异称为偏倚。偏倚可以用两种方法测量差值的均数来表示。
一致性界限(limits of agreement)差值均数的变异情况用其标准差sd来描述,如果差值的分布服从正态分布,那么95%的差值应当位于d-1.96sd和d+ 1.96sd之间,我们称这个区间为95%的一致性界限,绝大多数差值都位于该区间内。
注意:对于MedCalc软件算出来的P值,有两种,一种是单个指标做出来的P值;一种是多种指标做出来的P值,其P值是指各个互相比较,有没有差别有没统计学意义。
诊断试验真实性的评价指标
真实性(validity)亦称准确性(accuracy),指诊断试验的结果与实际情况的符合程度,是诊断试验研究最为关注的内容。探讨诊断试验的真实性,最基本的方法是将待评价的方法与诊断该病的“金标准”进行盲法比较,以评价其对疾病诊断的真实性。
诊断试验真实性研究的设计,首先要确定“金标准”;其次是选择研究对象,根据“金标准”将这些研究对象区分为“有病组”和“无病组”;第三,用待评价的方法测试这些研究对象,并将获得的结果与“金标准”的测试结果进行比较,应用相应的指标来评价该方法的诊断价值。
诊断试验的结果与“金标准”进行比较应实施独立的盲法评价,所谓的“独立”指所有研究对象都要同时进行诊断试验和“金标准”方法的测定,不能根据诊断试验的结果有选择地进行“金标准”方法测定;所谓“盲法”指诊断试验和“金标准”方法结果的判断或解释不受相互的影响。
待评价方法的结果与“金标准”方法的结果进行对比,可以建立一个四格表,包含了四个内容:真阳性(“有病组”中待评价方法为阳性)、假阳性(“无病组”中待评价方法为阳性)、假阴性(“有病组”中待评价方法为阴性)和真阴性(“无病组”中待评价方法为阴性)。通过这个四格表,可以简单地计算出诊断试验的真实性评价指标,包括灵敏度、特异度和似然比等。
1.灵敏度:也称“真阳性率”,即通过“金标准”方法诊断为“有病”且诊断试验也正确地判为“有病”(阳性)的概率。灵敏度只与“有病”组有关,灵敏度取值0~100%之间,理想为100%。
2.特异度:也称“真阴性率”,即通过“金标准”方法判断为“无病”且诊断试验也正确地判为“无病”(阴性)的概率。特异度只与“无病”组有关,特异度取值0~100%之间,理想为100%。
3.假阴性率:也称漏诊率或第二类错误(β),即通过“金标准”方法判断为“有病”但诊断试验结果为阴性的概率。与灵敏度为互补关系,即灵敏度越高,漏诊率越小,反映待评价的诊断方法发现患者的能力。理想的假阴性率为0。
4.假阳性率:也称误诊率或第一类错误(α),即通过“金标准”方法判断为“无病”而诊断试验结果为阳性的概率。与特异度为互补关系,即特异度越高,误诊率越少,反映鉴别未患病者的能力。理想的试验假阳性率应为0。
5.诊断试验界值:一项好的诊断方法应该既没有漏诊也没有误诊。灵敏度与特异度之间的关系则是当其中一个升高时,另一个必然降低。确定诊断试验界值的基本方法:正态分布法、百分位数法、ROC曲线法及临床判断法。
6.总符合率:又称一致性和准确度,表示诊断试验中真阳性病例数和真阴性病例数之和占全部受检人数的百分比。反映待评价的方法正确诊断患者与非患者的的能力,准确度越高,真实性越好,理想的总符合率为1。
7.约登指数(Youden’s index):又称正确诊断指数,是一项综合性指标。该指数常用来比较不同的诊断试验。约登指数于0~1间变动。该指标常用于评估诊断试验能否正确判断有病和无病的能力。
8.似然比(Likelihood ratio,LR):在应用灵敏度和特异度评价诊断试验时,两者看似相互独立,但实际上存在着本质的联系。同一种诊断方法如果取不同的临界值,会出现不同的灵敏度和特异度,通常灵敏度升高,特异度随之下降;特异度升高,灵敏度随之下降。因此,在评价诊断试验时仅仅描述灵敏度和特异度远不能反映诊断试验的全貌。似然比是指诊断试验的某种结果(阳性或阴性)在“有病”组中出现的概率与“无病”组中出现的概率之比,说明“有病”者出现该结果的概率是“无病”者的多少倍。似然比也是反映诊断试验真实性的一个指标,是反映灵敏度和特异度的复合指标,从而全面反映诊断试验的诊断价值。似然比比灵敏度和特异度更稳定,更不受患病率的影响。
在四格表中,阳性似然比(positive likelihood ratio,LR+)为诊断试验阳性结果在“有病”组中出现的概率(真阳性率)与在“无病”组中出现的概率(假阳性率)之比。阴性似然比(negative likelihood ratio,LR-)为假阴性率与真阴性率之比。似然比是评价诊断试验真实性的重要综合指标,阳性似然比越大,表明阳性结果的正确率高,研究对象的患病概率高。阴性似然比越小表示患病可能性越小,阴性结果正确率越高。
似然比的统计含义是比较验前比和验后比,对疾病诊断非常有帮助。根据试验前研究对象的患病率(验前概率,pre-test probability),结合似然比,应用下述公式可以估计研究对象新的患病率(验后概率,post-test probability)。具体步骤如下:
验前比(pre-test odds)= 验前概率/ (1−验前概率)
验后比(post-test odds)= 验前比 X似然比
验后概率 = 验后比/ (1+验后比)
请注意,概率必须先化成比数(odds)后才能与似然比相乘,而相乘后得出的验后比,也要再转变为概率,即验后概率。似然比大于1,则表明诊断试验后疾病诊断的概率增大;小于1,则表明诊断试验后疾病诊断减小。临床实践中,若似然比 > 10或
提高诊断试验效率的方法
1.选择患病率高的人群应用诊断试验
2.采用联合试验
3.联合试验的评价
4.为了提高灵敏度和特异度,除了探索新的试验方法之外,可以将现有的试验结合起来,称联合试验或复合试验。
5.平行试验(并联试验):如同时作几项检查方法来作诊断,只要其中有一项阳性即可诊断,这叫平行试验,可提高诊断的灵敏度,但费用增加。
平行试验适用于下列情况:
(1)急需迅速作出诊断。
(2)需要一种很灵敏的试验,但手中只有两项或两项以上不太灵敏的试验,组合成平行试验特别有用。
(3)提高了灵敏度和阴性预测值,使疾病漏诊减少,但降低特异度与阳性预测值,因此可能作出假阳性诊断。
6.系列试验(串联试验):采用系列试验,先选用简易、经济,灵敏度高,而且无损伤性方法检查,视需要再考虑进一步检查,逐步提高诊断的特异性(排除能力强)。
系列试验适用于下列情况:
(1)不需迅速作出诊断者。
(2)当某些试验昂贵且有危险性时,可用较简单安全的试验先做,一旦提示该病可能存在之后,才使用这些试验。
(3)当单项试验特异度不高时,系列试验特别有用。
(4)系列试验提高特异度和阳性预测值,但降低灵敏度和阴性预测值,试验阳性者表明患病更为可信,但增加漏诊疾病的危险性。
诊断试验评价中常见的偏倚
1.病情检查偏倚
只有对诊断试验出现阳性结果者才进一步用金标准方法加以确诊,而结果阴性者则不再做进一步检查就简单地认定无病,造成假阴性资料的缺乏。
2.疾病谱偏倚
诊断试验研究对象要求能很好地代表目标临床人群,包括该病的各种临床类型,如不同病情严重程度,不同病程阶段,有和无并发症者,还有哪些确实无该病,但易与该病相混淆的其他疾病等。回顾性设计是往往存在疾病谱偏倚。
3.参考试验偏倚
诊断试验的金标准不妥造成的偏倚。由于金标准不够准确,会造成错分(misclassification),即将有病者判为无病者,而将无病者判为有病者,将会影响诊断试验评价的准确性。
参考:《临床医学研究中的统计分析和图形表达实例详解》
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。
来源:孙医生工作室