卡方检验

✍ dations ◷ 2025-03-07 11:17:51 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 兔热病兔热病(拉丁语:Tularemia),又称野兔病(rabbit fever)、鹿蝇热(deer fly fever)、大原病(Ohara's fever)、法兰西斯氏病,一种因为细菌感染引起的人畜共通传染病。病原为土伦病法兰西斯氏
  • 食用油食用油,或称食油是纯化后供烹饪用的动物或植物油脂,于室温中呈液态或固态。常见的食油多数为植物油,通常用油料作物的种子经压榨或萃取获得。包括粟米油、花生油、橄榄油、芥花
  • 电磁搅拌器磁力搅拌器(英语:magnetic stirrer或称magnetic mixer)是一种通过快速旋转的搅拌子来搅拌液体的实验室设备。在其塑料面板下有旋转的磁铁来使搅拌子旋转,从而实现搅拌溶液。因为
  • 水体水体(英语:body of water或waterbody) 是一个译自英文的外来词,指各种明显具水的累积之处;通常位于地表或其他星球。水体一词,通常指的是较多水所累积之处,例如河海湖泊等,但也可指
  • 藓类植物门藓类植物门(学名:Bryophyta)是植物界的一门,是一类一般在1到10公分高左右的微小且柔软的有胚植物,但也有些物种会比较高大。只要有潮湿的环境与阳光照射就能轻易生长,没有花朵或种
  • 卡累利阿共和国卡累利阿共和国(俄语:Республика Карелия,罗马化:Respublika Kareliya,卡累利阿语:Karjalan tazavalda)是俄罗斯联邦的一个自治共和国。它位于俄罗斯的西北部,首都
  • NOF亚硝酰氟(NOF)是一种共价型的亚硝酰化合物。NOF是一种十分活泼的氟化剂,能将多种金属转化为它们的氟化物,并释放出一氧化氮:NOF也能与路易斯酸反应产生类似于盐的加合物,例如NOBF4
  • Insub2/subO氧化铟(I)是一种无机化合物,化学式为In2O。它是一种黑色的晶体粉末,不吸湿。氧化铟(I)可由氧化铟(III)的还原制备:草酸铟的热分解也能得到氧化铟(I):氧化铟(I)可以和盐酸反应,并
  • 卵黄囊卵黄囊(vesicula umbilicalis)是一个膜状囊连结在胚胎上,由胚胎盘附近的下胚层细胞所组成。这个构造也在胚胎学的术语中被称为脐带囊,尽管卵黄囊是比较被广泛熟知的名称。卵黄囊
  • 盆腔检查骨盆检查(又称骨盆腔检查、盆腔检查、内诊或是妇科检查),为妇产科中最基本的身体检查。其可粗略分为外部的检查和内部的检查两部分,内部检查于英文中又可称作“双手触诊”或是“