首页 >
卡方检验
✍ dations ◷ 2025-11-03 19:38:28 #卡方检验
卡方检验(Chi-Squared Test或
χ
2
{displaystyle chi ^{2}}
Test)是一种统计量的分布在零假设成立时近似服从卡方分布(
χ
2
{displaystyle chi ^{2}}
分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于
χ
2
{displaystyle chi ^{2}}
检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的
n
{displaystyle n}
个观察值被划分为
k
{displaystyle k}
个互斥的分类,这样每个分类都有一个对应的实际观察次数
x
i
{displaystyle x_{i}}
(
i
=
1
,
2
,
.
.
.
,
k
{displaystyle i=1,2,...,k}
)。研究人员会对实验中各个观察值落入第
i
{displaystyle i}
个分类的概率
p
i
{displaystyle p_{i}}
的分布提出零假设,从而获得了对应所有第
i
{displaystyle i}
分类的理论期望次数
m
i
=
n
p
i
{displaystyle m_{i}=np_{i}}
以及限制条件皮尔森提出,在上述零假设成立以及
n
{displaystyle n}
趋向
∞
{displaystyle infty }
的时候,以下统计量的极限分布趋向
χ
2
{displaystyle chi ^{2}}
分布。皮尔森首先讨论零假设中所有分类的理论期望次数
m
i
{displaystyle m_{i}}
均为足够大且已知的情况,同时假设各分类的实际观测次数
x
i
{displaystyle x_{i}}
均服从正态分布。皮尔森由此得到当样本容量
n
{displaystyle n}
足够大时,
X
2
{displaystyle X^{2}}
趋近服从自由度为
(
k
−
1
)
{displaystyle (k-1)}
的
χ
2
{displaystyle chi ^{2}}
分布。然而,皮尔森在讨论当零假设中的理论期望次数
m
i
{displaystyle m_{i}}
未知并依赖于必须由样本去进行估计的若干参数的情况时,记
m
i
{displaystyle m_{i}}
为实际的理论期望次数以及
m
i
′
{displaystyle m'_{i}}
为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为
X
′
2
{displaystyle X'^{2}}
也服从自由度为
(
k
−
1
)
{displaystyle (k-1)}
的
χ
2
{displaystyle chi ^{2}}
分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。
相关
- 喘鸣喘鸣(英语:Wheeze, Sibilant Rhonchi),又称啰音,是指呼吸过程中呼吸道持续产生的粗糙声音。哮鸣发生的原因是由于呼吸道的某些部分缩小或被堵塞,亦可能是呼吸道内的气流速度提高。
- ICD-9编码列表 (240–279)医学导航:遗传代谢缺陷代谢、k,c/g/r/p/y/i,f/h/s/l/o/e,a/u,n,mk,cgrp/y/i,f/h/s/l/o/e,au,n,m,人名体征药物(A16/C10)、中间产物(k,c/g/r/p/y/i,f/h/s/o/e,a/u,n,m)Templat
- ODD对立反抗症(Oppositional defiant disorder)简称ODD,在精神疾病诊断与统计手册第五版(DSM-5(英语:DSM-5))中列在“破坏性,冲动控制和行为障碍”(Disruptive, impulse-control, and con
- 对照实验对照实验(英语:control experiment)是在实验中设置比较对象(对照组)的一种科学方法,目的是为了与进行实验的对象(实验组)进行对照,减少实验中不确定的变数带来的影响,以之来显示出实验
- 詹姆斯·林德詹姆斯·林德(James Lind,1716年10月4日 - 1794年6月13日),英国皇家海军外科医生(1739年 - 1748年),皇家海军Haslar医院医师(1758年 - 1783年),是英格兰卫生学的创始人,发起利用柑桔类
- 菲涅耳衍射在光学里,菲涅耳衍射(Fresnel diffraction)指的是光波在近场区域的衍射。菲涅耳衍射积分式可以用来计算光波在近场区域的传播,因法国物理学者奥古斯丁·菲涅耳而命名,是基尔霍夫
- 赵淳生赵淳生(1938年11月-),中国机械工程专家。南京航空航天大学教授。生于湖南衡山。1961年毕业于南京航空学院飞机系,1984年获法国巴黎高等机械学院工程力学博士学位。2005年当选为中
- 超低穿透空气过滤网超低穿透空气过滤网(英语:Ultra Low Penetration Air Filter,缩写:ULPA),主要是用来去除0.1µm以上之微粒,过滤效果约为DOP 99.995%以上,过滤网材质为特殊玻璃纸。测试这些过滤网的
- 丁基橡胶丁基橡胶(英语:Butyl rubber,常用缩写是IIR ,代表Isobutylene Isoprene Rubber)是一种合成橡胶,是异丁烯和少量异戊二烯的共聚物,其中异戊二烯占0.6%到3%,根据异戊二烯的含量分成4-5
- 禁语禁忌或忌讳是指在一些特定的文化或是在生活起居中被禁止的行为和思想;如果被禁止的是某些词汇或物品的话,则称为禁忌语、禁忌物或禁忌品。有关的行为或词汇之所以会被禁止,可能
