P值

✍ dations ◷ 2025-08-06 11:35:07 #P值
p值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分 。对于一个统计模型的参数空间 Θ {displaystyle Theta } ,我们把参数空间划分为两个不相交的集合 Θ 0 {displaystyle Theta _{0}} 和 Θ 1 {displaystyle Theta _{1}} ,然后给定的随机样本 X = ( X 1 , ⋯ , X n ) {displaystyle X=(X_{1},cdots ,X_{n})} ,我们想检验参数在哪一个划分的空间我们构造的拒绝域是 对于一个可以探测参数 θ {displaystyle theta } 的统计量 T ( X ) {displaystyle T(X)} ,我们定义拒绝域为该统计量大于阈值 c {displaystyle c} 的形式:那么,一个拥有拒绝域是 R T {displaystyle R_{T}} 的假设检验方法,则该检验的统计功效函数被定义为一个检验的检验水准(size)是犯第一类错误概率的上确界 α = sup θ ∈ Θ 0 β T ( θ ) {displaystyle alpha =sup _{theta in Theta _{0}}beta _{T}(theta )} 。我们称一个检验具有显著性水平 α 0 {displaystyle alpha _{0}} ,如果它的检验水准小于等于 α 0 {displaystyle alpha _{0}} ,即假定对于所有小数 α 0 ∈ ( 0 , 1 ) {displaystyle alpha _{0}in (0,1)} ,存在一个显著性水平为 α 0 {displaystyle alpha _{0}} 的检验,其拒绝域是 R α 0 , T {displaystyle R_{alpha _{0},T}} ,那么p值的数学定义是满足包含关系 T ( X ) ∈ R α 0 , T {displaystyle Tleft(Xright)in R_{alpha _{0},T}} 的最小 α 0 {displaystyle alpha _{0}}也就是说p值是被定义为拒绝零假设 H 0 {displaystyle H_{0}} 的最低显著性水平。p值是基于数据的检验统计量算出来的概率值。如果p值是5%,也就是说,如果你以此为界拒绝原假设的话,那么有只有5%的可能性要犯错误。本来原假设是对的,但你却给拒绝了,这是要犯错误的。所以说p值越大,拒绝原假设的理由越不充分。如果p值接近于0,你拒绝原假设,那么你几乎不可能犯错误,于是说明数据是极其不符合原假设。换言之,是检验假设中零假设成立或表现更严重的可能性。p值若与选定显著性水平(0.05或0.01)相比更小,则虚无假设会被否定而不可接受。然而这并不直接表明原假设正确。通常在连续分布的假设下,p值是一个服从区间均匀分布的随机变量,在实际使用中因样本等各种因素存在不确定性。近100年来,统计学家使用p值来描述数据的统计显著性,这种方法造成了许多人在工作中把统计显著性的阈值(事先给定值)强行假定为大于等于实际显著性(实际数据计算出的p值),于是强行拒绝原假设,做出了很多不科学的决策。p值产生的结果可能会带来争议。2018年,由72位科学家组成的小组在《自然·人类行为》上发表了一篇名为《重新定义统计意义》的评论文章,赞同将统计显著性的阈值从0.05调整到0.005。这样就使得科研人员不能强行让如此小的统计显著性阈值大于实际数据计算出来的p值。这篇文章的主要作者本杰明认为:“这是一个不完美的短期解决方案,但可以立即实施。我担心的是,如果我们不立即做这事,我们将失去变革的动力,而我们最终将花费所有的时间争论理想化的解决方案。”在科学研究的许多领域,p值小于0.05被认为是确定实验数据可靠性的金标准。这个标准支持了大多数已发表的科学结论,违反这一标准的论文很难发表,而且也很难得到学术机构的资助。然而,即使是费雪也明白,统计显著性的概念以及支撑它的p值具有相当大的局限性。几十年来,科学家也逐渐意识到了这些局限性。1925年,英国遗传学家兼统计学家罗纳德·费雪(Ronald Fisher)出版了《研究者的统计方法》(Statistical Methods for Research Workers)一书。这本书的书名在当时看起来并不会“畅销”,但实际上这本书却取得了巨大的成功,而且还使费雪成为现代统计学之父。在这本书中,他着眼于研究人员如何将统计检验理论应用于实际数据,以便基于数据得出他们所发现的结论。当使用某个统计假设来做检验时,该检验能够概述数据与其假设的模型之间的兼容性,并生成一个p值。 费雪建议,作为一个方便的指南,研究人员可以考虑将p值设为0.05。对于这一点,他专门论述道:“在判断某个偏差是否应该被认为是显著的时候,将这一阈值作为判断标准是很方便的。”他还建议,p值低于该阈值的结论是可靠的,因此不要把时间花在大于该阈值的统计结论上。因此,费雪的这一建议诞生了p小于0.05等价于所谓的统计显著性,这成了 “显著”的数学定义。

相关

  • 单细胞生物生物可以根据构成的细胞数目分为单细胞生物和多细胞生物。单细胞生物只由单个细胞组成,而且经常会聚集成为细胞集落。单细胞生物能独立完成新陈代谢及繁殖等活动。地球上最早
  • 拟寄生物拟寄生物(Parasitoid)也称类寄生生物或捕食寄生生物,是指幼虫期寄生宿主体内,后期将宿主杀死,成虫营自由生活的生物,成虫多半会利用产卵管将卵注入至宿主体内。“拟寄生”是一种介
  • 甲烷生成产甲烷作用,又称甲烷生成,指合成甲烷是微生物代谢的重要的和广泛的形式。可以生成甲烷的微生物称作产甲烷菌(英语:Methanogen)。这些微生物都属于原核生物中的古菌域,这是在系统发
  • 法罗群岛坐标:61°57′15″N 6°51′25″W / 61.95417°N 6.85694°W / 61.95417; -6.85694面积以下资讯是以2017年估计国家领袖国内生产总值(购买力平价) 以下资讯是以2008年估计国内
  • 凝血/纤溶系统凝血因子是参与血液凝固过程的各种蛋白质组分。它的生理作用是,在血管出血时被激活,和血小板粘连在一起并且补塞血管上的漏口。这个过程称为凝血。它们部分由肝生成。可以为香
  • 地拉那地拉那(阿尔巴尼亚语:Tiranë),阿尔巴尼亚的首都和第一大城市,整个地拉那位于阿尔巴尼亚中部达埃蒂山和埃尔曾河西侧的内陆盆地,阿尔巴尼亚著名的拉纳河流经地拉那市中心地带。而
  • Jori, Alberto阿尔贝托·约里(意大利语:Alberto Jori,1965年7月2日-),意大利历史学家、哲学家,目前是德国杜宾根大学哲学系的教授。他同时也是亚里斯多德哲学的专家,在2003年,他借由关于亚里斯多德
  • 外骨骼外骨骼是节肢动物外壳的俗称,因为坚硬有如骨骼,因此得名。如螃蟹的壳、昆虫的角质层等。亦有人把乌龟的壳视为一种外骨骼。节肢动物的体表覆盖着坚硬的体壁。体壁由三部分组成
  • 奥尔梅克奥尔梅克文明(Olmec)是已知的最古老的美洲文明之一。它存在和繁盛于公元前1200年到公元前400年的中美洲(现在的墨西哥中南部)。“奥尔梅克”一词源自纳瓦特尔语中用以指奥尔梅克
  • Case-control studies病例对照研究是流行病学的其中一种研究设计。它是一种较廉宜及惯常使用的流行病学研究,只需少数的研究人员(甚至只是一个)及单一的设备,且不涉及有结构的试验。它的方法是指向一