统计中p值怎么计算 p值如何计算

点击上面,尽在AI中国 。
每个数据科学家都会遇到这样一个问题,什么是P值,我们如何在统计分析中使用它?
每个数据科学面试中至少有一个问题是关于P值及其目的的 。所以,在这篇文章里,我将讨论P值的语境、过程和目的 。对统计检验、置信区间和统计能力的错误解读和滥用已经被谴责了几十年,但仍然猖獗 。因为这些概念需要高度和时间,这种高认知需求导致捷径定义和解释的流行,这些定义和解释是完全错误的,有时甚至是灾难性的 。然而,这些误解在大多数科学文献中占主导地位 。
统计数字
在统计测试的大多数应用中,模型中的一个假设是特定的影响具有特定的大小,并且已经成为统计分析的目标 。这种有针对性的假设称为研究假设或检验假设,用来评价它的统计方法称为统计假设检验 。最常见的是,目标效应的大小是一个“空”值,表示零效应(例如,研究处理对平均结果没有影响) 。在这种情况下,检验假设称为零假设 。但是,也可以测试其他效果 。我们还可以检验假设效应是否属于特定范围;比如,我们可以检验效应不大于一定量的假设 。在这种情况下,假设被认为是片面假设 。
很多统计学教学和实践都形成了一种强烈的(也是不健康的)焦点,即研究的主要目的应该是检验零假设 。其实大部分统计检验的描述仅限于检验零假设,整个题目叫做“空假设显著性检验” 。零假设的这种排他性会导致对检验的误解 。更具误导性的是,许多作者使用“零假设”来指代任何测试假设,即使这种用法与其他作者不一致,并且在通用英语中被定义为“无效” 。
更精确的统计分析的目标是提供对影响的确定性或不确定性的评估 。我们用假设的“可能性”来表达这种确定性 。但是,在传统的统计方法中,“概率”并不是指假设,而是指在假设的统计模型下,数据模式的假设频率的个数 。这些方法因此被称为频率论方法,其预测的假设频率被称为“频率概率”,而不是假设概率(误解) 。
p值
假设频率称为P值,也称为检验假设的“观察显著性水平” 。p值和统计显著性的传统定义围绕着零假设,我们把所有其他用来计算p值的假设都视为完全正确 。由于我们不确定这些假设,我们将学习更一般的P值视图,这是对观察数据和我们预测或期望看到的数据之间的兼容性的统计总结,如果我们知道整个统计模型是正确的 。
测试统计(如T统计或卡方统计)用于测量数据和模型预测之间的距离 。如果每个模型假设都是正确的,包括检验假设,那么P值就是所选检验统计量至少与其观察值一样大的概率 。这一定义反映了传统定义中丢失的一个关键点:在逻辑上,P值测试所有关于数据如何生成的假设(整个模型),而不仅仅是它应该测试的目标假设(如零假设) 。
通过获得一个更小的p值,我们可以说,如果所有的假设都是正确的,那么数据将更加不寻常;但是一个非常小的p值并不能告诉我们关于假设有效性的任何事情 。我们举个例子 。当P值因为假设的目标而非常小时,可能是因为违反了研究方案而很小,也可能是用不正确的数据分析的 。相反,较大的p值表明数据在统计模型下并不罕见,但它并没有告诉我们关于模型的有效性和假设的任何事情 。由于违反了研究协议,它可能非常大,或者它可能使用不正确的数据进行分析,或者只是为了表达的目的而提出有效的观点 。
建立一个好的统计模型最好的方法是计算置信区间,现在很多期刊都需要这个 。
这种对检验中无效假设的关注,不仅会导致对检验和估计值评价的误解,还会掩盖P值和置信区间之间的密切关系,以及它们共同的弱点 。
【统计中p值怎么计算 p值如何计算】-- 展开阅读全文 --

    推荐阅读