卡方检验

✍ dations ◷ 2025-09-06 07:34:44 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 遗传性代谢缺陷遗传性代谢缺陷(英语:Inborn error of metabolism)在新陈代谢过程中,除了制造出营养外,如果身体未能将食物其他部分成功代谢成为可以从排泄器官(如消化系统,泌尿系统及排汗系统、呼
  • 灌肠医学的灌肠(enema)是指通过肛门引液体灌洗直肠的操作。有治疗疾病(例如便秘)、另类保健疗法、减重、或者非法虐待(例如性虐待)的用途。使用的器具及液体必须为医用,否则很容易引发
  • 卡西尔恩斯特·卡西尔(Ernst Cassirer,1874年7月28日-1945年4月13日),德国哲学家,生于西里西亚布雷斯劳(今波兰弗罗茨瓦夫),于1939年成为瑞典公民,死于美国纽约。受学于马尔堡的新康德主义传
  • 假借字假借字是汉字中的一类用字法,属于六书之一。其产生是书写者只考虑语音因素而未考虑形体因素造成的。汉字的数量有限,而语言中的词汇无穷,要用有限的文字纪录无穷的词汇,文字的表
  • 1910年1910年美国人口普查(英语:1910 United States Census)是美国历史上第13次全国人口普查,确定了美国的常住人口为91,972,266人,相比1900年美国人口普查,同比增长为21.0%。1910年的人
  • 帕特里克·莫迪亚诺《星形广场》(La Place de l'Étoile)(1968)、 《环城大道》(Les Boulevards de ceinture)(1972)、 《暗店街》(Rue des boutiques obscures)(1978)、 《多拉·布吕德》(Dora
  • 巴登-巴登巴登-巴登(德语:Baden-Baden),德国巴登-符腾堡州的城市,位于德国的西南部,黑森林的西麓,奥斯河谷,邻近卡尔斯鲁厄。巴登-巴登是著名的温泉疗养地、旅游胜地和国际会议城市。著名美国
  • 原子能电池原子能电池(又称核电池,氚电池或放射性同位素发电装置)是指那些使用放射性同位素衰变时产生之能量来产生电力的装置。这会使人误解成核反应堆,但实际上这种电池不是利用链式反应
  • 洪泛平原河漫滩,又称泛滥平原或洪泛平原,通常位于河流中下游,指由于河流堆积作用而形成的大片堆积体,是河流堆积地貌的一种。常在在枯水季节露出水面,在丰水季节又常被淹没。河漫滩一旦形
  • 布鲁托参数所指定的目标页面不存在,建议更正成存在页面或直接建立下列一个页面(建立前请先搜寻是否有合适的存在页面可以取代):布鲁图(英语:Pluto)是迪士尼经典动画角色之一,是一只土黄色