条件(配对)logistic回归分析的SPSS操作教程及结果解读

360影视 2025-02-24 23:31 1

摘要:在上一期,我们已经讲完了讲非条件(成组)logistic回归分析,这期开始讲条件(配对)logistic回归分析,我们主要从logistic回归分析介绍、条件logistic回归分析的使用条件、步骤及案例的SPSS操作演示这几方面进行讲解。

作者/风仕

在上一期,我们已经讲完了讲非条件(成组)logistic回归分析,这期开始讲条件(配对)logistic回归分析,我们主要从logistic回归分析介绍、条件logistic回归分析的使用条件、步骤及案例的SPSS操作演示这几方面进行讲解。

logistic回归分析介绍

按统计设计分为条件Logistc回归与非条件Logistc回归。

条件logistic回归,用于分析配对病例对照研究,条件logit是按因变量1:1或者1:n配对或者n:m配对的。条件logistic回归时,数据中一定需要记录下配对编号,比如1:2的配对(1个病例配对2个对照,且共有20个组,组别编号从1到20,那么同时会有3个1,3个2,3个3,类似下去),而且在分析时将配对编号放入对应框中。在做条件logistic回归时,因变量只能为0和1二分类数据。数字中只能包括0和1,如果不是,可使用[数据处理]->[数据编码]进行设置。

另一种是非条件logistic回归,用于分析成组数据或非配对的病例对照研究。

医学研究中,常釆用匹配设计,即为病例组的每一个研究对象匹配一个或几个同样特征的未患病者,作为该病例的对照,这样,除了研究因素外,病例与对照的其他特征相同,从而消除 “其他特征”的混杂作用,这样的Logistic回归称为条件Logistic回归(多项Logistic回归)。常用的匹配形式为1:1, 即一个病例匹配一个对照。

条件logistic回归分析使用条件

配对数据结构:条件Logistic回归分析适用于配对数据,其中每个病例可以匹配一个或多个对照。这种设计有助于控制潜在的混杂因素,使得两组在关键变量上更为相似。

案例的SPSS操作演示

分析示例

Mack 等人(19世纪 70年代)欲考察服用雌激素与患子宫内膜癌的关系,对退休居住在社 区的妇女进行调查。对照匹配的条件如下:与子宫内膜癌患者的年龄相差不超过一岁,婚姻状 况相同,居住在同一社区。除是否服用雌激素外,研究的自变量还包括胆囊病史和是否服用其他非雌激素药物,共计63 对数据。

数据录入

1. 变量视图

名称 id 标签 对子号

名称 casel 标签 患病

名称 agel 标签 病例年龄

名称 estl 标签 病例是否服用雌激素

名称 gall1 标签 病例是否有胆囊病史

名称 nonestl 标签 病例是否服用非雌激素药物

名称 case2 标签 对照

名称 age2 标签 对照年龄

名称 est2 标签 对照是否服用雌激素

名称 gall2 标签 对照是否有胆囊病史

名称 nonest2标签 对照是否服用非雌激素药物

2. 数据视图

操作流程

1. 对于1:1配对的Logistic回归,我们需要首先对数据进行预处理,生成新的变量以便进行分析,通过转换(T) 下拉菜单下的计算变量选项,首先生成新变量case =casel -case2。类似,还需要生成age =agel-age2;est =estl -est2;gall =gall1-gall2;nonest =nonest1 -no- nest2。这样就能在数据视图看到新生成的变量case,age,est,gall,nonest,以下步骤就对这些变量进行条件Logistic分析。

2.下图是进行条件Logistic回归的主对话框,因变量必须为一常数,如本例当中case =1,大家 需要注意的是casel -case2,即病例组-对照组,这个顺序不能颠倒了;因子框和协变量框均可选入 自变量,但是因子框中的变量系统默认为无序分类资料,会自动将其生成哑变量,而协变量框选入 连续变量或有序变量,在条件Logistic模型中,分析的自变量均为病例组-对照组后新生成的变量, 属于连续变量或有序变量,因此我们将age,est,gall,nonest 均选入协变量框中。

SPSS中没有专门进行条件 Logistic分析的过程,但是软件可以调用多项Logistic回归过程 进行分析,当软件发现因变量为一常数项时,系统自动切换为拟合条件Logistic模型,从而通过 拟合不包括常数项的模型实现1:1配对的Logistic回归。

3.下图是条件1:1回归模型进一步设定,由于模型要求不包含截距,若选入截距项,结果

中则会给出警告:因变量在具有截距项的模型中只有一个有效值,将不对任何模型进行拟合, 可通过移去截距对条件Logistic 回归模型进行拟合。

这里说明了两层意思,若因变量不止一个值,可以进行多分类Logistic 回归分析;若因变量只有一个值,则需要去掉截距项,系统进行条件Logisitc 回归分析。

结果解释

1.下表是系统给出的提示,说明因为因变量只有一个值(1),系统进行条件 Logistic回归 模型拟合。这里需再次提醒大家,进行条件Logistic回归分析的两个必要步骤:由病例组-对照 组生成新的变量;去除模型的截距项(常数项)。

2.下表给出了进行分析的数据概况,共63条记录,无缺失值。

3.下表是对模型中的所有偏回归系数是否均为0进行似然比检验,其结果为x²= 34.159,P

4.下表给出了三类伪决定系数,伪决定系数反映了模型中所有自变量揭示的因变量总变 异的比例,但对于 Logistic回归模型而言,伪决定系数的大小不像线性回归模型中的决定系数那么大。

5.下表是从当前模型中分别剔除每一个自变量后拟合新的条件Logistic回归模型的负二 倍似然对数值,用于考察是否可以从当前模型中剔除该自变量。可以看出年龄age、是否服用 非雌激素药物nonest 的 P 值均>0.05,提示可以采取逐步回归法对当前模型中的自变量进行筛选。

6.下表是条件Logistic回归分析中最重要的部分,包括了模型中各变量偏回归系数(B), 标准误(SE),Wald 卡方值(Wals), 自由度(df),P值(显著水平),以及OR 值(Exp(B))。由结果可以看出,变量是否服用雌激素est 的偏回归系数为2.698,Wald 检验结果P=0.01

参考:《临床医学研究中的统计分析和图形表达实例详解》

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

来源:孙医生工作室

相关推荐