首页 >
卡方检验
✍ dations ◷ 2025-01-23 01:59:40 #卡方检验
卡方检验(Chi-Squared Test或
χ
2
{displaystyle chi ^{2}}
Test)是一种统计量的分布在零假设成立时近似服从卡方分布(
χ
2
{displaystyle chi ^{2}}
分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于
χ
2
{displaystyle chi ^{2}}
检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的
n
{displaystyle n}
个观察值被划分为
k
{displaystyle k}
个互斥的分类,这样每个分类都有一个对应的实际观察次数
x
i
{displaystyle x_{i}}
(
i
=
1
,
2
,
.
.
.
,
k
{displaystyle i=1,2,...,k}
)。研究人员会对实验中各个观察值落入第
i
{displaystyle i}
个分类的概率
p
i
{displaystyle p_{i}}
的分布提出零假设,从而获得了对应所有第
i
{displaystyle i}
分类的理论期望次数
m
i
=
n
p
i
{displaystyle m_{i}=np_{i}}
以及限制条件皮尔森提出,在上述零假设成立以及
n
{displaystyle n}
趋向
∞
{displaystyle infty }
的时候,以下统计量的极限分布趋向
χ
2
{displaystyle chi ^{2}}
分布。皮尔森首先讨论零假设中所有分类的理论期望次数
m
i
{displaystyle m_{i}}
均为足够大且已知的情况,同时假设各分类的实际观测次数
x
i
{displaystyle x_{i}}
均服从正态分布。皮尔森由此得到当样本容量
n
{displaystyle n}
足够大时,
X
2
{displaystyle X^{2}}
趋近服从自由度为
(
k
−
1
)
{displaystyle (k-1)}
的
χ
2
{displaystyle chi ^{2}}
分布。然而,皮尔森在讨论当零假设中的理论期望次数
m
i
{displaystyle m_{i}}
未知并依赖于必须由样本去进行估计的若干参数的情况时,记
m
i
{displaystyle m_{i}}
为实际的理论期望次数以及
m
i
′
{displaystyle m'_{i}}
为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为
X
′
2
{displaystyle X'^{2}}
也服从自由度为
(
k
−
1
)
{displaystyle (k-1)}
的
χ
2
{displaystyle chi ^{2}}
分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。
相关
- 第四纪第四纪(英语:Quaternary Period,符號Q)是地质时代中的最新的一个纪,包括全新世和更新世两个世。第四纪前是新近纪。它从约260万年前开始,一直延续至今。第四纪这个名称最早是意大
- 法国开发署法国开发署(法语:Agence française de développement)是法国致力于战胜贫困与可持续发展的公共金融机构。开发署在非洲、亚洲、中东、拉丁美洲、加勒比海和法国海外领土为人
- 科罗拉多壁虱热病毒科罗拉多壁虱热病毒(Coltivirus),是 呼肠孤病毒科(Reoviruses) 的一个属。 该类病毒会感染如猪等动物,造成如猪流行性腹泻等疾病。代表种:
- 那加兰那加兰邦(印地语:नागालैण्ड,拉丁字母转写:Nāgāland)是印度的一个邦,位于印度东北部的喜马拉亚山脉,西连阿萨姆邦,南接曼尼普尔邦。该邦名称“那加兰”字面意为“那加人(居
- 人类文明英文中的文明(英语:civilization)一词源于拉丁文“civilis”,有“城市化”和“公民化”的含义,引申为“分工”“合作”,即人们和睦地生活于“社会集团”中的状态,也就是一种先进的
- 分子构型分子结构,或称分子立体结构、分子形状、分子几何、分子几何构型,建立在光谱学数据之上,用以描述分子中原子的三维排列方式。分子结构在很大程度上影响了化学物质的反应性、极性
- 已歇业航空公司已结业的斯威士兰航空公司列表:已结业的赤道几内亚航空公司列表已结业的阿尔巴尼亚航空公司列表航空史 · 飞行器(制造商) · 飞行器发动机(制造商) · 旋翼机(制造商) · 机场 ·
- 玉皇大帝玉皇上帝,通称玉皇大天尊,简称玉皇、玉帝,俗称玉皇大帝、天公,宋代尊称之为昊天玄穹玉皇上帝。玉皇上帝源自中国自古以来信仰的昊天上帝。中国人自从原始社会开始就崇敬“天”,最
- 祖辈祖先,又称祖亲、祖宗,是指辈分比自己高的直系血亲,与后代相反。然而,很多时候所指的祖先,通常都是最少隔几代,年代久远的则称为远祖。在很多父系社会,狭义的祖先一词只代指父亲那边
- 一群犬只在1950年代到1960年代之间,苏联太空署使用一群犬只进行次轨道和轨道上的太空飞行,以确认人类太空飞行的可行性。在成为太空犬之前,这些犬只是莫斯科的流浪犬。在1950年代到1960