参数、非参数检验、秩和检验的区别与选择---孙医生工作室带你学统计学(挑战SCI)第14天

摘要:在上一期,我们已经讲完了方差分析,这期开始讲秩和检验,我们首先来理清秩和检验的基础知识,主要从参数和非参数检验区别与选择、秩和检验的基础定义、原理及适用条件这几方面进行讲解。

作者/风仕

在上一期,我们已经讲完了方差分析,这期开始讲秩和检验,我们首先来理清秩和检验的基础知识,主要从参数和非参数检验区别与选择、秩和检验的基础定义、原理及适用条件这几方面进行讲解。

参数和非参数检验

参数检验

参数检验,是在总体分布已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。最常见的参数检验包括回归系数检验、比较检验和相关性检验。参数检验的方法有T检验、Z检验、F检验、方差分析(ANOVA)、二项分布总体的假设检验、皮尔森的相关性等,这些检验都是假设样本来自于正态分布的总体,将总体的数字特征看做未知的参数,通过样本的数据特征对其总体进行统计推断。

非参数检验

由于种种原因,人们往往无法对总体分布形态做简单假定,此时参数检验方法就不适用了。非参数检验,是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。非参数检验推断过程中不涉及有关总体分布的参数。常用的非参数检验的方法有两个独立样本的K-S检验、W-W检验、U检验、Spearman相关性等,多个独立样本的H检验、中位数检验等,卡方检验,二项分布检验、拟合优度检验等。

参数检验和非参数检验主要的区别

1.参数检验是针对参数做的假设;非参数检验是针对总体分布情况做的假设,这是区分的一个重要特征;

2.根本区别在于,参数检验要利用到总体的信息(总体的分布、总体的一些参数特征,如方差),以总体分布和样本信息对总体参数做出推断;

非参数检验不需要利用总体信息,直接以样本信息对总体分布做出推断;

3.正态分布用参数检验,非正态分布用非参数检验。

参数检验与非参数秩和检验中各类方法对比:

如何选择参数和非参数检验

在参数测试和非参数检验之间进行选择取决于几个因素,例如:

数据分布:如果数据呈正态分布,则参数检验更合适,因为它们具有更强的统计能力(更擅长检测显着影响)。如果数据不是正态分布的,则应使用非参数检验,因为它们对数据的假设较少。

样本大小:当样本大小较小时,非参数检验更适合,因为它们对样本分布的假设更少。当样本大小较大时,参数检验更可靠。这是因为非参数检验对违反假设的敏感性较低,而这种情况更可能发生在小样本中。

等方差:参数检验假定各组之间的方差相等。如果数据不是等方差的,则应改用非参数测试。数据分布的偏斜程度:如果数据分布严重偏斜,则非参数检验可能更可靠,因为它们对分布的假设更少。

检验目的:如果需要检验的是中位数、百分位数、比例等非参数统计量,那么非参数检验更适合。如果需要检验均值、标准差等参数统计量,那么参数检验更可靠。

方差分析与秩和检验的选择:

非参数检验适用的资料类型

非参数检验由于不受总体分布类型的限定,可适用于任何分布型的资料。尤其是以下几种:

1.总体分布类型未知的资料;

2.数据分布呈现明显偏态的资料;

3.某些变量无法精确测量的资料;

4.方差不齐;

5.只能以严重程度、优劣等级、次序先后等表示的登记资料;

6.数据的一端或者两端为不确定值的资料,如50等,俗称开口资料。

非参数检验的检验效能

非参数检验的适用范围非常广泛,但是由于检验的是分布而不是参数,所以损失了部分资料信息,故通常认为非参数检验方法的检验效能低下。但实际上,根据国外的一项研究,它的检验效能大约为参数检验的95%左右,并非低得不能接受,因此当数据可能违背参数检验条件时,最好直接采用相应的非参数检验方法。

非参数检验的方法

非参数检验的方法很多,有符号检验、游程检验、等级相关分析、秩和检验、卡方检验等。本章介绍基于秩次基础上的秩和检验(rank sum test) 。

非参数检验分析模块

SPSS主要在分析下拉菜单项中的非参数检验中实现,其包含的具体统计过程如下:

1.单样本:单样本秩和检验。

2.独立样本:两组或多组独立样本秩和检验。

3.相关样本:配对样本秩和检验。

秩和检验

基础定义

秩和检验(rank sum test)又称顺序和检验,它是一种非参数检验(nonparametric test)。它不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否已知,因而实用性较强。

‍1.什么是秩

秩——Rank是指排名大小。设X为一总体,将容量为n的样本观察值按照自小到大的顺序编号为X1

例如:有5个人的身高,分别是187cm、183cm、190cm、176cm、177cm。现要求写出该组数据对应的秩。因为:176

2.秩和检验

用秩代表原始数据后,所得某些秩次的和,称为秩和,用秩和进行假设检验即为秩和检验。

使用秩代表原始数据,考虑了数据的大小,数据相对大小意义仍然存在,它不仅可用于成对和两组数据的比较,还可用于两个按等级分组的计数数据的比较,应用广泛,其计算方法和计算步骤,也相当简便。

秩和检验可分为以下几种:

检验原理说明

秩和检验简单来讲就是:先排序得到秩、然后使用秩和进行检验。

先将所有样本数据按照大小排序,再根据排序后的位次(即秩)来比较不同组之间的总体差异,而不是直接比较原始数据的大小。

这种方法尤其适合处理不满足正态分布的数据,以及数据含有明显离群点的情况。

基本步骤:

1.秩分配:将所有观测值按照从小到大的顺序排列,并赋予相应秩(最小值为1,依次递增)。

2.秩和计算:分别计算每个组的秩和。

3.检验统计量:通过计算各组的秩和差异,结合检验统计量来判断这种差异是否具有显著性。

秩和检验使用条件:

秩和检验是一种非参数统计检验方法,适用于多种研究场景,特别是在样本大小和数据特性不符合传统参数检验要求的情况下。以下是秩和检验的主要使用条件:

1.样本独立性:检验假设基于两个独立样本的比较,这意味着每个样本中的数据点与另一个样本中的数据点无关。

2.数据分布:秩和检验不依赖于数据的正态分布。它适用于非正态分布的数据,特别是当数据一端或两端存在不确定数值时。

3.样本大小:尽管秩和检验对样本大小的要求不如参数检验严格,但适当的样本量仍然是确保检验有效性的重要因素。

4.数据类型:适用于定量数据和有序分类数据。对于定量数据,检验假设基于中位数的比较;对于有序分类数据,则基于等级强度的差异。

5.应用场景:秩和检验常用于比较两个独立样本的中位数差异,或者多个独立样本的中位数是否存在显著差异。此外,它也适用于配对样本的比较,尤其是在差值不符合正态分布的情况下。

参考:《临床医学研究中的统计分析和图形表达实例详解》

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

来源:孙医生工作室

相关推荐