卡方检验

✍ dations ◷ 2025-06-28 13:26:42 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 列夫·舍斯托夫列夫·舍斯托夫 (英语:Lev Isaakovich Shestov, 俄语:Лев Исаа́кович Шесто́в, 1866年2月12日-1938年11月19日), 出生叫Yeguda Leib Shvartsman (俄语:Ие
  • 溶血反应溶血反应泛指红血球的不正常分解死亡的现象。溶血是指红血球的细胞膜因物理因素、化学因素、生物因素等因素受损破裂,内部的原生质从细胞漏出令红血球死亡的现象。“溶血反应
  • 核医学放射性药物列表本表罗列出核医学放射性药物。一些放射性同位素¤在应用时采用的是离子形式或惰性形式,并没有依附于某种药物;这张列表之中也收录有此类的核医学放射性药物。在这张列表之中,每
  • 植物油列表植物油是自植物中萃取的脂肪与油类,依照提炼方式的不同,分为压榨油、提炼油和香精油等三种油品。将欲榨取部位加压,进而提取所得的植物油称为“压榨油”,其又分为“冷压油”和“
  • 生乳生乳是指奶畜乳房中挤出的未经过巴氏消毒等方式加工的常乳,最初温度一般和牲畜体温相似。根据中华民国99年7月2日署授食字第0991301848号令发布,生乳是指从“符合有关要求的健
  • 内布拉斯加内布拉斯加州(英语:State of Nebraska)是美国中西部大平原区的一州,它的名称来自美国原住民中的奇维雷语,意为平顺之水。该州有普拉特河贯穿整州。过去曾是美国大荒野的一部分,不
  • 春分数据来源:喷气推进实验室线上历书系统春分是二十四节气之一,为春季九十天的中分点,公历日期约略落于每年的3月21日前后(20日~22日)。太阳到达黄经0°(春分点)的日子,古时又称为“日中
  • 阿拉伯数字汉语中通称的阿拉伯数字(英语:Arabic numerals)是西方或欧洲形式的印度-阿拉伯数字。印度-阿拉伯数字系统由古代印度的婆罗米人发明,后经由阿拉伯传入西方。很多语言都引用了此
  • 父爱母爱和父爱是母亲、父亲对子女的关心和爱护,例如把儿子和女儿由婴儿期、儿童、青少年,直至成年,供书教学,关怀照顾等。母爱是这个世界上最温柔的力量,它为你保驾护航。母爱常被描
  • 达特茅斯学院1,081(2014年秋)达特茅斯学院(英语:Dartmouth College /ˈdɑːrtməθ/ DART-məth),是一座位于美国东北部新罕布什尔州汉诺威镇的一所私立大学,是常春藤联盟成员。该校建于1769年