2026-06-15 21:39:55

如下所示:

每次进行假设检验时,需要假设统计数据的分布,在例子中是本校学生的平均睡眠时间。对于z检验,用正态分布作为检验统计量分布的近似。一般来说,根据中心极限定理,从数据分布中得到更多的均值,则均值趋向于正态分布。但是,这仍然是估计值,因为现实世界的数据并不完全服从正态分布。假设正态分布可以确定研究中观察到的结果有多大意义。z值越高或越低,那么结果越不可能是偶然发生的,也越有可能是有意义的。为了量化结果的意义,通常会使用了另一个概念。

最后一个核心概念是p值。p值是当零假设为真时,观察到至少与测量结果一样极端的结果的概率。

这可能看起来有点复杂,所以来看一个例子。

假设正在测量美国佛罗里达州和华盛顿州的平均智商。零假设为,华盛顿州的平均智商不高于佛罗里达州的平均智商。通过研究,发现华盛顿的智商高出2.2个百分点,p值为0.346。这意味着,在零假设(华盛顿的平均智商并不高于佛罗里达的平均智商)为真的世界里,测量华盛顿智商至少高出2.2个百分点的可能性为34.6%。因此,如果华盛顿的智商实际上并没有更高,但由于随机噪声,仍然有1/3的概率测量出华盛顿智商至少高出2.2个百分点。p 值越低,结果越有意义,因为它不太可能是由噪声引起的。

结果是否具有统计学显著性,取决于在开始实验之前建立的显著性p值(称为alpha)。如果观察到的p值小于α,则结果具有统计学意义。需要在研究之前选择α,因为如果在研究之后,人们可以选择一个数字来证明结果是有意义的,不管数据显示什么!

α的选择取决于情况和研究领域,但最常用的值是0.05,相当于结果是随机发生的概率为5%。在平时的统计学中,常用的值为0.1到0.001之间。作为一个极端的例子,发现希格斯玻色子粒子的物理学家使用了0.0000003的α值,或者说只有350万分之一的概率是由于噪声而发现的该粒子。

为了从正态分布的z值得到p值,可以使用表格或者像R这样的统计软件。结果将显示出z值低于计算值的概率。例如,对于z值为2的情况,p值为0.977,这意味着只有2.3%的概率会随机观察到z值高于2的情况。

作为迄今为止的总结,提出了三个概念:

假设检验:用来检验理论的一种技术

正态分布:假设检验中数据的近似表示

p值:如果原假设为真,则出现至少与观测值一样极端的结果的概率

那么,把这些放在睡眠例子中:

根据国家睡眠基金会的数据,全国的学生平均每晚睡眠7.02小时

在本校对202名学生的调查中,平均每晚睡眠时间为6.90小时,标准差为0.84小时

备择假设是,本校学生的平均睡眠时间低于全国大学生的平均睡眠时间

使用α=0.05,这意味着当p值小于0.05时,结果是显著的

首先,需要将测量值转换成z值。从测量值中减去总体均值(全国平均值),再除以样本数的平方根除以标准差。(随着样本数目的增加,标准差及其变化会减少,因此用样本数量的平方根除以标准差来解释这个现象。

有了z值测试统计量,就可以使用表格或者编程语言(比如 r)来计算p值。

基于0.02116的p值,可以拒绝零假设。(统计学家倾向于拒绝零而不是接受备择假设)。有统计学上显著的证据表明,本校学生比美国大学生的平均睡眠时间少,显著水平为0.05。P值显示我们的结果有2.12%的可能是由于随机噪声。

在学校禁止所有家庭作业之前,需要注意不要给这个结果过多的关注。如果使用α=0.01,那么p值0.02116就不再重要了。如果有人想在研究中证明相反的观点,简单地操纵α值就可以达到。每当检验一项研究时,除了结论之外,还应该考虑p值和样本量。由于样本数量相对较小,只有202个,研究可能具有统计学意义,但这并不意味着它具有实际意义。此外,这是一个观察性研究,这意味着只有相关性的证据,而不是因果关系。研究表明,本校学生和平均睡眠时间的减少之间存在相关性,但这并不意味着去该学校会导致睡眠时间的减少。可能还有其他因素影响睡眠,只有随机对照研究能够证明其中的因果关系。

与大多数技术概念一样,统计显著性并不复杂,只是许多小概念的组合。大多数的麻烦来自于学习词汇!一旦把这些碎片放在一起,就可以开始应用这些统计概念了。当学习了统计学的基础知识,就能更好地以一种健康的怀疑态度来看待研究和新闻,可以看到数据实际上说了什么,而不是别人告诉你它的意思。

硕博招聘信息汇总

↓↓↓↓

【官方】本硕博高学历互助式公益交友平台

关于我们

经管世界【ID:ourjingguan】

经管世界公众号由大数据与金融团队创建,所有推送文章通过人工智能选取。

100万+经管人的选择。

经管世界成立专门团队独家收集整理学术会议、征文等信息,并在公众号第一时间推送,更多相关整理后的资讯请在公众号回复关键字征文获取。返回搜狐,查看更多