【原】把p值,一类错误和拒绝域一次性说清楚

【原】把p值,一类错误和拒绝域一次性说清楚

显著性水平(α):

α 通常被设定为 0.05,这是一个先验设定的阈值。它表示在原假设为真时,我们犯“拒绝原假设”这一错误的概率(即犯第一类错误的概率)最多为 5%。

2. p 值的含义:

p 值 是在假设原假设为真时,观察到比实际数据更极端的结果的概率。也就是说,p 值告诉我们,在原假设为真时,获得当前或更极端的数据的可能性有多大。

如果 p 值很小,这意味着在原假设为真的前提下,获得我们观察到的数据的概率非常低,这让我们怀疑原假设是否真的成立。

3. 拒绝域和决策:

拒绝域 是指那些在原假设成立时极不可能出现的结果所在的区域。我们预先设定一个显著性水平 α 来定义这个区域。

当 p 值 小于等于 设定的 α 时,表示观察到的数据非常极端,极端到足以让我们怀疑原假设的成立性。因此,在这种情况下,我们选择 拒绝 原假设。

4. 犯第一类错误的概率:

第一类错误(Type I Error)指的是在原假设为真的情况下,错误地拒绝了 原假设.

显著性水平 α 控制了我们愿意承受的犯第一类错误的最大概率。

5. 为什么 p 值落在拒绝域时要拒绝原假设?

当 p 值落在拒绝域时,意味着在假设原假设成立的情况下,观察到我们所得到的数据是非常不可能的(即 p 值非常小)。这时,我们有理由怀疑原假设的成立性,从而选择拒绝原假设。

注意:p 值小并不意味着犯第一类错误的概率小,而是意味着如果我们假设原假设为真,那么我们观察到的结果出现的概率很小。因此,我们倾向于认为原假设可能并不成立,从而选择拒绝它。

6. 实际解释:

假设 α=0.05,这意味着我们允许有 5% 的可能性犯第一类错误(即在原假设为真时错误地拒绝它)。

当 p 值 < 0.05 时,我们认为数据足够极端,不支持原假设的成立,因此拒绝原假设。

p 值越小,意味着数据越不支持原假设,但这并不改变我们所设定的 α(即我们愿意承受的最大第一类错误概率)。

总结:

显著性水平 α 是一个预先设定的阈值,用来控制我们犯第一类错误的概率。

p 值是根据数据计算出来的,用来评估在原假设成立的情况下,数据的极端性。

当 p 值小于 α 时,意味着在原假设为真时,观察到的数据极端性很高,我们因此选择拒绝原假设。

这段话强调的是 p 值和显著性水平的比较,以及它们在决定是否拒绝原假设中的作用。

统计量1 和 统计量2:这两个统计量都落在了拒绝域内,意味着在这两种情况下,我们都拒绝了原假设 H0H_0H0。

拒绝域(α):这是我们设定的显著性水平,它对应的区域表示在原假设成立时,非常不可能观察到的结果。在图中,显著性水平 α 对应的区域是图中阴影部分的右侧区域。

P值:

图中,统计量1和统计量2所对应的 p 值分别是 P1 和 P2。p 值表示的是在原假设成立的情况下,得到等于或更加极端的观察值的概率。

P1 对应统计量1的 p 值,P2 对应统计量2的 p 值。

从图中可以看出,P1 的阴影面积比 P2 大,这意味着 P1 > P2。

关键点解释为什么统计量2犯第一类错误的概率小于统计量1?

第一类错误的概率,即在原假设为真的情况下,错误地拒绝原假设的概率,取决于 p 值的大小。p 值越小,说明数据在原假设成立时越不可能发生,因此我们有更大的理由怀疑原假设,从而拒绝它。

在图中,统计量2对应的 p 值(P2)比统计量1的 p 值(P1)小,因此统计量2所对应的结果更极端,更不可能在原假设成立的情况下出现。

因此,当我们基于统计量2做出拒绝原假设的决定时,相比于统计量1,我们犯第一类错误的可能性(即错误拒绝原假设的可能性)更低。

图上哪个统计量的 p 值更大?从图上看,统计量1 的 p 值(P1)更大,因为它对应的阴影面积比 统计量2 的 p 值(P2)更大。因此,P1 > P2。

结论:统计量2 的 p 值更小,这意味着在原假设成立时,统计量2所观察到的结果更加不可能发生,因此犯第一类错误的概率也更小。

尽管统计量1和统计量2都落在了拒绝域中,最终的决策都是拒绝原假设,但统计量2提供了更强的证据去拒绝原假设。

养生小贴士

古代的妾命运有多惨?只能拼命生孩子,生下后也不能亲自抚养
中国最出名最好的蜂蜜产地在哪里?看看有你的家乡没有!
Collector's Album - MC百科
💡 小知识

Collector's Album - MC百科

📅 09-05 👍 388