卡方检验

✍ dations ◷ 2024-07-05 11:32:53 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 膀胱肠瘘管膀胱肠瘘管(Vesicointestinal fistula),又称肠膀胱瘘管(Intestinovesical fistula)是膀胱于肠道之间的瘘管。膀胱肠瘘管瘘管能够依据其发生的位置给予更精确的命名:造成膀胱肠瘘管
  • 大肠激躁症大肠激躁症(英语:Irritable bowel syndrome),又称为大肠躁郁症、肠躁症、躁性大肠征候群、肠易激综合征,主要为没有任何肠胃道疾病损伤下出现腹痛及排便型态改变的症状。这些症状
  • 北卡罗莱纳州北卡罗来纳州(英语:State of North Carolina),简称北卡州,是位于美国南部区域大西洋海岸的一州。别称“柏油脚跟州”或“旧北州”。下辖100县。州府为罗利,最大的城市为夏洛特。北
  • 斯多葛主义斯多葛主义(英语:Stoicism),斯多葛又译斯多噶或斯多亚,古希腊和罗马帝国思想流派,哲学家芝诺于公元前3世纪早期创立,在雅典时他常“在门廊”(希腊语发音为斯多噶)讲学,传人有克雷安德
  • 行距在字体排印学,行距(Leading)指代字体连续行的基线间的距离。这个词起源于手工排版的年代,铅字之间通过插入铅块来增加垂直距离。这个术语仍然被应用于如 QuarkXPress(英语:QuarkXP
  • 分体法分体法(英文:Partonomy),又称为分体学或分体论,是一种基于部分-整体关系的分类系统。分体法不同于生物分类学之类的分类法(taxonomy;又称为分类学),因为后者乃是基于相似性的分类系统
  • 氟苯氟苯是有机化合物,分子式为C6H5F,通常简写为PhF。这种物质是苯的衍生物,氟原子与苯环直接相连。其熔点为-44℃,低于苯,这是由于氟取代基破坏苯环的对称性,使分子无法如未取代的苯
  • 劳合·乔治大卫·劳合·乔治,第一代德威弗尔的劳合-乔治伯爵,OM,PC(David Lloyd George, 1st Earl Lloyd-George of Dwyfor,1863年1月17日-1945年3月26日),英国自由党政治家,在1916年至1922年间
  • 唐纳德·格拉泽唐纳德·格拉泽(英语:Donald Arthur Glaser,全称唐纳德·阿瑟·格拉泽,1926年9月21日-2013年2月28日),美国物理学家,1960年获得诺贝尔物理学奖。1926年出生于俄亥俄州克利夫兰。1950
  • 格奥尔格·弗里德里希·亨德尔格奥尔格·弗里德里希·亨德尔(德语:Georg Friedrich Händel,1685年2月23日-1759年4月14日),巴洛克音乐作曲家,创作作品类型有歌剧、神剧、颂歌及管风琴协奏曲,著名作品为《弥赛亚