白话统计学06—标准误(学习分享)

引言:

      前面我们学习了正态分布资料中的标准化和z分数。在这一小节中,我们利用关于均值、标准差、正态分布、z分数和概率的信息来解释统计学中重要的概念——标准误。

一、标准误详解

(1)均值标准误的概念描述

这里我们主要学习均值的标准误。到底什么是标准误呢?

举个例子,假设我们想知道中国成年女性的平均鞋码。在这项研究中,我们感兴趣的总体是中国全部成年女性。但普查势必劳民伤财,所以我们从总体中随机选取100名女性作为样本。这100名女性的鞋码样本也许能代表总体中国成年女性,也有可能不能(如表现出一个极端的现象,极小或极大)。如果有放回的进行第二次抽样,再随机选取一个容量相同(100)的样本,那么第二个样本的平均鞋码可能与第一个样本的相同或者不同。进一步,如果我们选取1 000个不同的随机女性样本,每个样本容量均是100,然后计算每个样本的平均鞋码,这1000个样本均值就组成其自身的分布。这种分布称为均值的抽样分布(sampling distribution of the mean)。

均值的抽样分布具有均值和标准差。为了将抽样分布与简单频数分布区别开来,均值抽样分布的均值称为均值的期望值(expected value of the mean)。之所以称为期望值,是因为均值抽样分布的均值与总体均值一样。从总体中选取一个样本,样本均值的最佳猜测是与总体均值一样,所以我们的预期均值就是总体均值。均值抽样分布的标准差称为标准误,故标准误就是抽样分布的标准差。

均值的标准误为我们提供了哪些信息?标准差是分布中的单个取值与分布均值之间的平均差异或平均离差。均值的标准误本质上提供了同样的信息,只是它指的是单个样本均值与其期望值(例如总体均值)之间的平均差异。所以均值的标准误,可以理解为对样本均值代表实际总体均值的确信程度。换言之,均值的标准误测量了样本均值代表更大总体均值的预期误差,这正是称之为“标准误”的原因所在。

(2)如何计算标准误?

大多数时候,研究者们不会从总体中抽取1 000个容量相同的样本,然后计算这个样本均值分布的均值和标准差。实际上,大多数时候,研究者只从单个样本中收集数据,然后利用这一样本来推断从中抽样的总体。如何根据单个样本来推断更大的总体呢?

用前面提到的关于鞋码的例子来说明这一概念,假定现有包括100名妇女的一个随机样本。如果这个样本确实是随机选取的(即每位成年中国女性都有相等的机会被选中),那么最合乎逻辑的假设就是这一样本恰当地代表了更大的总体,从而有理由相信样本的均值鞋码(假设为36.5码)也是更大总体的均值鞋码。当然,事实究竟是否如此,无从知道。此时有一个关键问题:如果我(根据样本平均数)猜测中国成年女性总体的平均鞋码为36.5,那么这种估计的预期误差有多大?换言之,标准误有多大?回答这一问题需要考察样本的两个特征。

第一, 样本有多大?样本越大,对总体进行估计时误差就会越小。因为样本越大,越接近总体,从而对总体的估计也就越准确。如果中国有1亿女性,那么可以将其中5 000万作为样本,也可以用100名作为样本,前者有望比后者更加准确地预测平均鞋码。

第二,样本的标准差是多少?标准差度量了样本取值的变异程度。如果样本取值非常分散,那么就可以假设总体中的取值也比较分散。如果样本中有一些妇女的鞋码是34,而另外一些的鞋码是40,那么我就能够假设总体中的鞋码同样有相当大的变异。相反,如果样本中所有妇女的鞋码不外乎36、36.5、37,那么我就能假设更大总体中的变异程度也不大。样本标准差越大,总体取值的假设变异程度也越大,相应地,均值的标准误也越大。(注意:如果在某些情形中已知总体标准差,可直接代人计算均值的标准误。)

第三,标准误与样本的含量、样本或总体的标准差有关,公式见表6-2。

从均值标准误的计算公式中可以发现,样本标准差(或已知的总体标准差)以及样本容量是决定标准误的核心因素。标准差保持不变的条件下,随着样本容量的增加,均值标准误减少。样本容量相等的条件下,随着标准差变大,均值标准误也变大。标准误一般用作推断统计量计算公式的分母。因此,标准误越小,诸如z分数和t值之类的统计值就越大,统计值越大,研究者就越有可能判定样本表明一种有意义的或者统计显著(statistically significant) 的效应。因此,在其他条件相同的情况下,样本容量越大,标准误越小,越可能得到统计显著的结果。

(3)中心极限定理

虽然我们不必了解中心极限定理的推导过程,但需要理解这一定理为何如此重要——很多统计量都依赖于从正态分布中得到的概率。确定这一概率的前提是样本均值服从正态分布,或者均值的抽样分布是正态的。中心极限定理(central limit theorem)表明,只要样本容量足够大(例如n=30),即使样本取值的分布不是正态分布,均值的抽样分布也服从正态分布。

二、正态分布与t分布: z分数与t值的对比

通过前面的学习,我们知道样本标准差的计算公式中分母为n- 1,由此可知样本越小,用样本标准差估计总体标准差就越不准确。而标准误的公式(表6-2)将标准差作为一个组成部分,故小样本会影响到标准误。为了解决这个问题,这里我们得引进一个新的分布,它是z分布的近亲家族——t分布。为什么说是近亲呢?随后揭晓答案。

1. 标准误已知:利用标准误计算出基于正态分布的z分数及其概率。

      2. 总体特征未知、仅有小样本数据的条件下:标准误无法精确求得,只能用样本估计的标准误代替总体标准误,形成t分布族。如下图:这些分布与正态分布非常相似,呈对称分布,只是t分布的形状仅受样本容量的影响。大样本条件下(例如大于120),t分布与正态分布的形状几乎完全一样。然而,随着样本容量的减少,t分布的形状就会变得中间更平坦、两端更粗厚。换言之,随着样本容量的减少,均值周围的取值变得更少,远离均值、位于分布尾部的取值变得更多。

3.使用t值表查找与t分布相关的概率。t值表中左侧一列升序排列着数字代表自由度(degrees of freedom),自由度直接与样本容量相关。使用这个表的时候,先根据公式计算出t值,然后在适当自由度的一行找出该t值的位置,就可以在t值表中找出得到这么大t值的概率。

三、t分布的应用

当总体标准差未知时,不得不使用样本估计值,此时就适合用t分布族。现举例说明t分布和z分布的差别与联系:

①假设已知中国成年男性平均每周运动时间为60分钟。进一步假设有一个包括144名男性的随机样本,样本平均每周运动时间为65分钟,标准差为10分钟。如果实际总体均值为60,那么有多大概率随机得到这种容量的均值为65的样本?要回答这一问题,就得计算t值:

查阅t值表,因t值表中可查的最大自由度为120,故从自由度为∞的那一行中可知,从这种容量的样本中随机得到这么大或者比这更大的t值的概率小于0. 001。注意到如果我们计算的是z分数而不是t值(即如果总体标准差是10),那么就会得到同样大小的z分数。从z界值表中可查得,对应的概率约为0. 000 000 009,同样小于0.001 (见图6-3)。(z分数所对应的)正态分布与t分布在样本容量大于120时几乎完全一样。

②现假设我们的样本容量是25而不是144。方法同前,计算t值:

查t值表,从自由度为24的那一行可知,得到这么大或者比这更大的t值的概率大约为0.02 (见图6-4)。如果样本容量扩大至144,即查自由度为无穷大的t值表或者z值表,那么得到2.50或者更大t值的概率就接近0.01。故小样本时,t分布和u分布下的概率显著不同。

③结论:在大样本条件下,正态分布与t分布几乎完全一样。但随着样本容量减小,t分布发生改变,从而相应的概率也随之改变。当总体标准差已知时,可以用正态分布。但当总体标准差未知,或者样本容量较小时,就应该用t分布族。

总结

用标准误来确定样本统计值(例如均值)的概率和用标准分数来确定个别取值的概率,两者的原理十分相似。正因为标准误可用于确定概率,所以标准误在决定一个统计值是否统计显著时至关重要。

因为标准误受样本容量影响,所以统计显著性也受到这些样本特征的影响。下一小节将继续学习统计显著性问题以及样本容量对统计显著性的影响。

参考书籍:
1.中国人民大学出版社《白话统计学》第3版   蒂莫西.C.厄丹(Timothy C.Urdan)著,彭志文译
统计与绘图

白话统计学07—统计显著性与置信区间(学习分享)

2019-11-30 18:02:05

统计与绘图

白话统计学05—标准化和z分布(学习分享)

2019-11-30 18:03:39

加入Q群
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索