卡方检验

✍ dations ◷ 2024-12-22 18:54:28 #卡方检验
卡方检验(Chi-Squared Test或 χ 2 {displaystyle chi ^{2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布( χ 2 {displaystyle chi ^{2}} 分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于 χ 2 {displaystyle chi ^{2}} 检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的 n {displaystyle n} 个观察值被划分为 k {displaystyle k} 个互斥的分类,这样每个分类都有一个对应的实际观察次数 x i {displaystyle x_{i}} ( i = 1 , 2 , . . . , k {displaystyle i=1,2,...,k} )。研究人员会对实验中各个观察值落入第 i {displaystyle i} 个分类的概率 p i {displaystyle p_{i}} 的分布提出零假设,从而获得了对应所有第 i {displaystyle i} 分类的理论期望次数 m i = n p i {displaystyle m_{i}=np_{i}} 以及限制条件皮尔森提出,在上述零假设成立以及 n {displaystyle n} 趋向 ∞ {displaystyle infty } 的时候,以下统计量的极限分布趋向 χ 2 {displaystyle chi ^{2}} 分布。皮尔森首先讨论零假设中所有分类的理论期望次数 m i {displaystyle m_{i}} 均为足够大且已知的情况,同时假设各分类的实际观测次数 x i {displaystyle x_{i}} 均服从正态分布。皮尔森由此得到当样本容量 n {displaystyle n} 足够大时, X 2 {displaystyle X^{2}} 趋近服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布。然而,皮尔森在讨论当零假设中的理论期望次数 m i {displaystyle m_{i}} 未知并依赖于必须由样本去进行估计的若干参数的情况时,记 m i {displaystyle m_{i}} 为实际的理论期望次数以及 m i ′ {displaystyle m'_{i}} 为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为 X ′ 2 {displaystyle X'^{2}} 也服从自由度为 ( k − 1 ) {displaystyle (k-1)} 的 χ 2 {displaystyle chi ^{2}} 分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。

相关

  • 缺血性心脏病冠状动脉疾病(英语:coronary artery disease, CAD)又称为缺血性心脏病或简称冠心病(英语:ischemic heart disease, IHD)、冠状动脉粥状硬化心脏病、冠状动脉粥状硬化心血管疾病(英
  • 人格障碍人格障碍(英语:personality disorders),或人格(性格)疾患/异常/违常。是精神疾病中,对于一群特定拥有长期而僵化思想及行为病患的分类。这类疾患常可因其人格和行为的问题而导致社会
  • 纳布啡纳布啡是一种阿片类受体的镇静剂型精神药物,其镇静效果类似吗啡,有呼吸抑制作用但不明显。同时其抑制有封顶效应,无心血管副反应,临床上一般用于手术后镇痛。
  • 中国科学院院士中国科学院院士,是中华人民共和国设立的科学技术方面的最高学术称号,为终身荣誉。授予在科学技术领域做出系统的、创造性的成就和重大贡献的中国籍科学家。院士不设任期,为终身
  • 妊娠期妊娠期是指雌性哺乳动物从受精至分娩的这段时间。 不同的动物的妊娠期是不同的。大多数物种妊娠期的长短取决于胎儿出生时的体型。小型动物的妊娠期通常比大型动物短。 例
  • 场致发射电子场致发射,简称场发(Field electron emission,field emission (FE))理论最早是在1928年由拉尔夫·福勒与罗特哈·诺德海姆(英语:Lothar Nordheim)共同提出,其原理当在两导电体间
  • 塞韦罗·奥乔亚塞韦罗·奥乔亚·德阿尔沃诺斯(Severo Ochoa de Albornoz,1905年9月24日-1993年11月1日),西班牙裔美国生物化学家,1959年诺贝尔生理学或医学奖获得者。塞韦罗·奥乔亚出生于西班牙
  • 曼内·西格巴恩曼内·西格巴恩(瑞典语:Karl Manne Georg Siegbahn,1886年12月3日-1978年9月26日),瑞典物理学家,1925年,他因为发现X射线的光谱,而获得1924年度的诺贝尔物理学奖殊荣。值得一提的是,他
  • 汴梁汴梁指北宋首都东京开封府,即“汴京”,现河南省开封市。汴梁多次遭到水灾,现在的开封是在地面6-9米以下北宋东京城遗址上建立的。开封在历史上有多个政权在此建都,有“开封古城,十
  • 默克手册《默克手册》(英语:The Merck Manuals)默克制药公司出品的医学参考书,涵盖范围广泛的医疗相关课题,包括疾病、测试、诊断和药物。这些手册最初是以书本形式发行,现已转化为网上的