SPSS进行数据转化(变量的转化)的操作步骤演示

本期一“统”天下为大家介绍使用SPSS进行数据转化的操作。

连续变量与分类变量的转化是临床统计中常见的操作。包括连续变量向分类变量的转化以及分类变量不同分类/等级之间的合并。

不管香槟师兄需要几行代码完成,反正SPSS可以轻松实现这一功能。

一、连续变量转化为分类变量

将连续变量转化为分类变量往往是基线表(Table 1)制作的第一步,对研究人群整体资料的呈现,后续的回归分析、亚组分析都具有重要的意义。

对于临床上有定义正常范围的连续变量,一般根据临床定义的截点进行分组。在演示数据中,我们按照中国标准的BMI范围,以18.5≤BMI<23进行分组。

Transform→Recode into Different Variables

选择BMI进入右侧转换方框,在Output Variables对话框中命名新变量:BMI_3,点击Change:

点击Old and New Values:

选择Range, LOWEST through value选项,在下方输入第一组的上限,注意此对话框的设置中,下限均为开区间,上限均为闭区间,第一组的BMI值设置为<18.5,此处应输入18.4999999,在New Value框中选择Value,输入1,点击Add:

选择Range选项,在上下限框内分别输入18.49999和22.99999,在Value框输入2,点击Add:

选择Range, value through HIGHEST,输入22.99999,Value框内输入3,点击Add:

点击Continue后回到上一个选项框,点击OK即可,可见数据列表生成新的分类变量BMI_3.

 

而对于临床上尚无明确定义范围的变量,一般在探索阶段会先根据需要按样本量进行等分。在本次演示数据中,我们将人群按年龄进行三等分。

点击Analyze→Descriptive Statistics→Frequencies

选择AGE变量进入Variable(s)框,点击Statistics,勾选Cut points for ,填写3,点击Continue,将Display frequency tables的勾选取消,点击OK

结果框显示将AGE三等分的截点:

后续步骤同前述已知截点的分组方式。

 

二、分类变量类型的合并

临床统计中,分类过多的原始变量往往会影响回归分析中结果的稳定性,尤其是其中某些分组的样本量过少的时候,如果该分类变量不是该研究的主要研究变量,往往需要将分类变量的进行适当的合并。

在演示数据中,教育程度在原始问卷中被细分为6个等级,在回归分析中,一般合并为三个等级(低、中、高)即可。

与前述转化类似,点击Transform→Recode into Different Variables

选择Education进入右侧转换方框,在Output Variables对话框中命名新变量:Education_3,点击Change,点击Old and New Values:

在Old value框选择Value,输入1,在New Value框输入1,点击Add;

在Old value框选择Value,输入2,在New Value框输入1,点击Add;

在Old value框选择Value,输入3,在New Value框输入2,点击Add;

在Old value框选择Value,输入4,在New Value框输入2,点击Add;

在Old value框选择Value,输入5,在New Value框输入3,点击Add;

在Old value框选择Value,输入6,在New Value框输入3,点击Add;

点击Continue,点击OK即可。

注意: 上述转换操作一般需一次完成,不要分步骤完成,否则会出现新旧变量替换过程出现重复造成错误。

统计与绘图

如何根据Logistic回归列线图计算患者风险得分?

2020-10-2 22:34:18

统计与绘图

Origin绘图中的常见问题集锦

2020-10-5 22:24:47

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索