卡方检验

✍ dations ◷ 2025-07-06 08:17:49 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 固体物理学固体物理学是凝聚态物理学中最大的分支。它研究的对象是固体,特别是原子排列具有周期性结构的晶体。固体物理学的基本任务是从微观上解释固体材料的宏观物理性质,主要理论基础
  • 亨利·贝克勒尔亨利·贝克勒尔(法语:Henri Becquerel,1852年12月15日-1908年8月25日),法国物理学家。因发现天然放射性现象,与居里夫妇一同获得1903年诺贝尔物理学奖。受伦琴发现X-射线的启发,贝克
  • 强力胶水万能胶,又称快干胶、三秒胶、瞬间胶、502胶,所含作为组合剂的成分为氰基丙烯酸酯(Cyanoacrylate)。氰基丙烯酸酯是一系列物质的合称,譬如 2-氰基丙烯酸甲酯(Methyl-2-cyanoacrylat
  • 季候风季风(又称季候风)是周期性的风,随着季节变化,并且盛行风向(40%以上风频)季节切变达120度以上(按照传统定义,非全球性季风定义)。主要发生在季风亚洲(东亚、东南亚、南亚地区)、西非几内
  • 布洛克县布洛克县(Bulloch County)是位于美国佐治亚州东部的一个县,面积1,754平方公里,县治斯泰茨伯勒。根据2000年美国人口普查,共有人口61,457。布洛克县成立于1796年2月8日,县名源自佐
  • Ciliophora纤毛虫是纤毛虫门(学名:Ciliophora)生物的通称,是一类较复杂的原生动物,主要特点是以纤毛作为运动器,细胞核一般分化出大核(营养)、小核(生殖)、摄食胞器等,无性生殖为横二分裂,有性生殖
  • 单磷酸胸苷胸苷单磷酸(Thymidine monophosphate,TMP)是一种核苷酸,可见于DNA分子中,含有磷酸基团、五碳糖,以及碱基胸腺嘧啶。
  • 双链核糖核酸病毒核糖核酸病毒(英语:RNA virus),又称RNA病毒,其遗传物质为RNA,这些核糖核酸通常是单链RNA(ssRNA),但是也可能是双链RNA(dsRNA)。由RNA病毒感染造成的著名人类疾病包括艾滋病(AIDS)、埃博
  • 冷却曲线‎冷却曲线(cooling curve)是表示物质相变化的曲线,一般是由液态到固态或是从气态到固态。其自变量(X轴)是时间,应变量(Y轴)是温度,以下是一个铸造中用到的冷却曲线。冷却曲线的启始点
  • 聚丁烯聚丁烯(Polybutene,PB)是一种高分子惰性聚合物,主要是由丁烯聚合而成。与聚丙烯和聚乙烯皆为经常使用的塑胶材料。聚丁烯主要用于自来水管、热水管与暖气管等等管道的管壁材料。