白话统计学12—重复测量方差分析

引言:通过前面的学习,我们可以知道配对样本t检验可以处理一个因变量在两个时间点的取值。但是,如果要检验因变量在两个以上时点的结果是否具有差异,我们该采用什么方法呢?今天我们学习重复测量方法分析,专门针对具有多个时间点测量结果的差异分析。

一、情景引入

假设我们探究饮酒是否影响成年人驾驶时的反应时间。通常我们会选取50位成年人作为一组,测试同一组成员在3种不同的情景下的制动反应时间。具体方法如下:

方案1:

1.在每个测试成员清醒时,驾驶时亮起红灯,然后测试其开始踩刹车的间隔时间。

2.在每个测试成员喝下2杯酒精饮品后,测试红灯亮起时开始刹车的间隔时间。

3.在每个测试成员喝下4倍酒精饮品后,测试红灯亮起时开始刹车的间隔时间。

重复测量方差的结果便会告诉我们,平均而言,三次测试的反应时间是否相同。如果得出有差异分结论,那么我们就可以初步得出饮酒影响反应时间的结论(但实际上,对这一结果可能有很多其他的解释——因为前面的试验设计比较简单,而未能考虑其他可能影响因变量指标的其他因素,如体重、参与者对试验的态度等,从而忽略了可能的影响因素)。

为了使我们的结果更加可靠,我们纳入一些协变量,以控制协变量的不均衡而导致结论偏差。有人称“等量酒精往往对体重较小的人有更大的影响”,故为了在试验中扣除体重对重复测量方差分析结论的影响,我们可将体重作为分析的协变量,需对上述的试验步骤进行更正:

方案2:测量随机纳入50名受试成年人的体重,并测量其在3种不同条件下的反应时间。

对纳入的数据进行控制了体重的重复测量方差分析,便可剔除体重对反应时间的影响,使得饮酒与反应时间的关系更加明确。

但即便是在控制体重的影响这种情况下,试验中也可能存在其他的混杂因素,有机构称“在等量酒精的作用下,女性较男性的受影响程度更加剧烈”,故我们需要再一次更正研究方案:

方案3:随机纳入50名体重不同的成年人(25名男性和25名女性),分别测试他们在3种条件下的反应时间。

最后我们得到3个时间点下的因变量(不同饮酒状态下的反应时间)、协变量(体重)和一个分组变量(性别)。我们三次试验方案得到的结论有区别吗?以下展示不同方案中的结果:

试验方案一结果:50名受试者在3种条件下的反应平均时间的确有所不同,喝2杯的受试者的反应时间长于未饮酒的受试者,喝4倍的受试者的反应时间又长于喝两杯的受试者(见图12-1)。

试验方案二结果:在控制或剔除了体重的效应之后,受试者在未饮酒和喝了两杯之后的反应时间并没有差异,但喝了四杯之后比未饮酒或喝了两杯之后平均反应更慢(见图12-2)。方案一和二的结果表明饮酒会使体重较小的人在只喝两杯之后反应变慢,但不管体重如何,喝了四杯之后,所有人的反应时间都会变长。

试验方案三结果:在控制了协变量(体重)的效应之后,未饮酒和喝两杯之后测量的反应时间仍然没有差异,但平均而言喝四杯之后的反应时间更长。另外,并没有发现性别和饮酒杯数对反应时间的交互效应。试验结果告诉我们,无论体重如何,男女在喝四杯之后都会反应变慢(见图12-3)。

二、重复测量方差分析详解

1、重复测量方差分析变异分解原理

当前后测量设计的重复测量次数为3次或3次以上时,称为重复测量设计或重复测量数据。复测方差分析的一般原理与所有的方差分析原理都一样,均是因变量总变异的分解。在复测方差分析中,如果没有分组自变量的话,那么我们感兴趣的还是误差方差,但也想弄明白因变量方差中有多大部分可归因于不同测度时点的个体间差异和试验因素的差异。

根据基本方差的变异分解的原理,我们可以将重复测量数据的总体变异进行分解,如下

总变异 = 受试者间(组间) + 不同时间/条件(组内) + 误差

 

同时,我们也可以在误差中扣除协方差所解释的部分,即:

总变异 = 受试者间(组间) + 不同时间/条件(组内) +协方差+ 误差’

2、重复测量方差分析的特殊条件——“球对称”假设:

重复测量方差数据类似于随机区组设计数据,即同一个个体的前后多次测量数据为一个区组,但重复测量方差分析又不完全等同于随机区组方差分析。重复测量设计区组内试验单位彼此不独立,即不同时间点测得的结果是来自同一个个体,同一个体的测量结果是高度相关的(如治疗前后的血糖水平、增重处理前后的体重水平等等)。为了使该数据用于随机区组设计方差分析,数据必须满足“球对称”(sphericity)假设。

经Mauchly“球对称”检验后(球对称检验的零假设:数据满足球对称假设),当p值>0.05时,则认为该数据满足球对称假设;反之则不满足球对称假设,应对组内效应的F界值进行校正(校正的方法是校正自由度),常用Greenhouse-Geisser、Huynh-Feldt和Lower-bound三种方法,但有资料提示推荐采用Greenhouse-Geisser。

三、重复测量方差分析应用前提条件

同一般方差分析一样,数据需要满足以下条件:

  • 独立:各组数据独立,互不相关。

  • 正态性:各组数据服从正态分布。

  • 方差齐性:各组方差相等。

  • 球对称假设(重复测量方差分析的特殊条件):对于被试者内因素的各个水平组合而言,因变量的协方差矩阵相等。球形检验(Mauchly’s test of sphericity) , 适用于重复测量时,检验不同测量之间的差值的方差是否相等,用于三次以及三次以上水平的重复测量(因为两次重复测量根本就没有办法比较差值的方差,只有一个方差)。

四、重复测量方差分析案例分析

为研究两种固定设备对脊柱前屈活动的影响,以12个脊柱骨(T12~L2)标本为研究对象,随机分为两组,一组为5例,用固定设备1固定,称为A组;另一组7例,用设备固定2固定,称为B组,分别测量每一个标本在正常、损伤、固定和疲劳状态下的最大前屈度(数据见表1)。试进行方差分析。

注:简单解释一下表头:group为分组变量,正常前屈、损伤状态、固定状态和疲劳状态对应的数据为不同状态下的最大前屈度(即不同时间段共测量4次的因变量)。如果你的数据满足这种类型,就可以考虑重复测量方差分析。

下面小编在SPSS软件中演示如何完成该分析:

1、数据输入:使数据的格式满足SPSS重复测量方差分析的格式(在SPSS数据设置列名的时候,尽量使用英文单词作为列名,同时在设置变量的页面中使用label标签注明中文注解)。

2、选定分析→一般线性模型→重复测量分析→设定参数(详细步骤如下):

注:以下步骤仅供参考,你也可以选择不同的参数进行个性化的设置。

① 选定重复测量方差分析模型

②设置组内效应的参数(有4个状态,分别对应4种不同的测量状态)和分组变量。如果需要与试验结果无关的协变量,可将变量添加至协方差栏(covariates)以扣除协方差解释变异的部分。

③模型设置:选择系统默认的模型(全模型,即可以考虑组间效应、以及相互效应的模型)

④交互作用轮廓图参数设置:可以将分组或者状态设置为横轴,同时将状态或者分组作为分隔直线的亚变量。

⑤分析选项设置:设置展示不同分组或者不同状态下的数据的描述统计量、进行同质性检验、使用LSD方法进行不同分组和不同状态差异的显著性检验。

⑥最后,设置完成后,点击“OK”,就可以查看结果了。

3. 主要输出结果与解释

统计描述部分:第一个表格展示的是组内因素(status),即4种不同状态。第二个表格展示的是组间因素(对应分组因素A和B)。第三个表格展示的是不同状态下两个分组中数据的均值、标准差和样本例数。

注意:学习统计的时候一定要时时刻刻提醒自己,即使样本中不同状态下的数据有差异,不同组间的数据也有差异,这些差异仅有通过统计检验,才能最终明确其所代表的的总体是否具有差异,才能做出合理的统计推断。

Mauchly“球对称”检验结果:检验统计量Mauchly’s W=0.545,p=0.384。故可以得出不拒绝球形假设,认为其满足球对称性。在应用单变量检验方法时无需使用Greenhouse-Geisser等方法校正,无需使用校正的自由度。

上图展示的是组间效应的比较:分组(group)对应的F值为0.179,p=0.681,故不能认为两种固定仪器对脊柱前屈活动的影响有统计学差异。换个说法就是,认为两种固定仪器对脊柱前屈活动的影响无统计学差异。

组内差异比较,即不同状态下测量值的比较:

①  本资料满足球形假设,故以“Sphericity Assumed”对应的第一行结果为准,反正则应该选择后面3行中对应的结果。

②  重复因素有4个水平(4种状态)间的差异具有统计学差异(p<0.001)。

③  状态与分组(两种不同的固定仪器)间无交互作用(p=0.282)。

在前面的输出结果中,我们得出组内效应(4个重复水平)具有差异,接着就应该进行多重比较。在多重比较的输出结果中:除了3和4对应的状态,即固定前屈和疲劳前屈对应的最大前屈度之间没有显著差异,其余各状态间均有显著差异。

最后,输出交互作用轮廓图(可以选择以分组或者状态为变量分割直线),进一步补充证实前面的检验结果:两个分组间无明显差异;除3和4状态相近外,其余状态间具有较显著的差异。

五、小结

重复测量方差分析是前面我们讨论的单因子方差分析的扩展,它解决的问题是不同分组在多个不同时间段的单变量指标是否具有差异,以及时间效应(不同状态)是否与分组效应具有交互作用。如果我们需要控制影响结局指标的变量,我们可将其纳入协方差进行进一步探究,即重复测量协方差分析,原理可参考上一小节中的协方差分析。

如果你想深入掌握方差分析的内容,这两节的内容是远远不够的,一定要多查阅资料。接下来的一小节我们会探究简单线性回归和多元线性回归,有没有很期待呢?我们下期再见啦……

参考书籍:
1.中国人民大学出版社《白话统计学》第3版   蒂莫西.C.厄丹(Timothy C.Urdan)著,彭志文译
2.人民卫生出版社《医学统计学》第4版 孙振球,徐勇勇著
统计与绘图

利用R语言tableone和survival包整理制作三线表

2019-11-15 21:31:02

统计与绘图

白话统计学11—因子方差分析和协方差分析(学习分享)

2019-11-29 23:47:27

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索