首页 >
卡方检验
✍ dations ◷ 2025-08-16 05:51:50 #卡方检验
卡方检验(Chi-Squared Test或
χ
2
{displaystyle chi ^{2}}
Test)是一种统计量的分布在零假设成立时近似服从卡方分布(
χ
2
{displaystyle chi ^{2}}
分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授(英语:Mansfield Merriman),而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正。直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族(英语:Pearson Distribution)。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。在1900年,皮尔森发表了著名的关于
χ
2
{displaystyle chi ^{2}}
检验的文章,该文章被认为是现代统计学的基石之一。在该文章中,皮尔森研究了拟合优度检验:假设实验中从总体中随机取样得到的
n
{displaystyle n}
个观察值被划分为
k
{displaystyle k}
个互斥的分类,这样每个分类都有一个对应的实际观察次数
x
i
{displaystyle x_{i}}
(
i
=
1
,
2
,
.
.
.
,
k
{displaystyle i=1,2,...,k}
)。研究人员会对实验中各个观察值落入第
i
{displaystyle i}
个分类的概率
p
i
{displaystyle p_{i}}
的分布提出零假设,从而获得了对应所有第
i
{displaystyle i}
分类的理论期望次数
m
i
=
n
p
i
{displaystyle m_{i}=np_{i}}
以及限制条件皮尔森提出,在上述零假设成立以及
n
{displaystyle n}
趋向
∞
{displaystyle infty }
的时候,以下统计量的极限分布趋向
χ
2
{displaystyle chi ^{2}}
分布。皮尔森首先讨论零假设中所有分类的理论期望次数
m
i
{displaystyle m_{i}}
均为足够大且已知的情况,同时假设各分类的实际观测次数
x
i
{displaystyle x_{i}}
均服从正态分布。皮尔森由此得到当样本容量
n
{displaystyle n}
足够大时,
X
2
{displaystyle X^{2}}
趋近服从自由度为
(
k
−
1
)
{displaystyle (k-1)}
的
χ
2
{displaystyle chi ^{2}}
分布。然而,皮尔森在讨论当零假设中的理论期望次数
m
i
{displaystyle m_{i}}
未知并依赖于必须由样本去进行估计的若干参数的情况时,记
m
i
{displaystyle m_{i}}
为实际的理论期望次数以及
m
i
′
{displaystyle m'_{i}}
为估计的理论期望次数,认为的值通常为正且足够小以至于可以忽略。皮尔森总结为,如果我们认为
X
′
2
{displaystyle X'^{2}}
也服从自由度为
(
k
−
1
)
{displaystyle (k-1)}
的
χ
2
{displaystyle chi ^{2}}
分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文发表后才暂告一段落。
相关
- 勃起功能障碍勃起功能障碍(Erectile dysfunction,缩写:ED),为男性性功能障碍的一种,其特征在于阴茎在性行为期间无法勃起或维持勃起:538-39。勃起功能障碍可能会产生心理上的后果,因为它与关系
- 索拉非尼索拉非尼(Sorafenib),商品名蕾莎瓦®(Nexavar® ) ,是美国拜耳股份有限公司的专利药,经美国食品药物管理局核可用于治疗肾细胞癌及肝癌。2012年8月1日,台湾健保局通过健保给付蕾莎
- 厂厂部,就汉字索引来说,是为部首之一,康熙字典214个部首中的第二十七个(两划的则为第二十一个)。简体字将廠字(俗作厰)简化为厂,两字同形。厂部归于两划部首。厂部通常是从左上方为部
- 蒙索罗城堡蒙索罗城堡(法语:Château de Montsoreau) 是位于卢瓦尔河流域法国蒙索罗的一座结合了哥特和文艺复兴风格的法式城堡,城堡主体于1862年被定为法国历史遗迹。 它被直接建筑在卢
- T7RNA聚合酶T7 RNA聚合酶(英语:T7 RNA Polymerase)是一种RNA聚合酶,分子量约99kDa。专门催化5'→3'方向的RNA形成过程。T7RNA聚合酶具有高度启动子专一性,且只会转录T7噬菌体中位于T7启动子
- 陈定信陈定信(1943年7月6日-),非博士出身的国立台湾大学医学院院长,一路从医师做到医学院院长,为中央研究院院士,并于2005年获选为美国国家科学院外籍院士。陈定信早年跟随宋瑞楼教授研究
- span class=nowrapInsub2/sub(SOsub4/sub)sub&g硫酸铟是铟的硫酸盐,化学式为In2(SO4)3。它是一种无机化合物,由铟、氧化铟或其碳酸盐和硫酸反应得到,制备过程中,硫酸需要过量,否则会生成难溶的碱式盐。硫酸铟可以以无水物、五
- 姬蜚蠊科见内文姬蜚蠊科(学名:Ectobiidae),又名斜翅蜚蠊科,是蜚蠊目匍蜚蠊总科之下两个科之一,可分为四个亚科,领223属2381种,属于该科的蜚蠊体型均较小。其下较著名的种包括德国姬蠊、亚洲
- Commodore 64康懋达64(英语:Commodore 64),也称为C64、CBM 64或在瑞典被称作VIC-64是由康懋达国际于1982年1月推出的8位家用电脑(首次在1982年1月7日至10日,于拉斯维加斯消费电子展上展出。)。
- 概率测度概率测度是概率空间中定义在一个事件集合上的、满足测度性质(例如可列可加性)的实值函数。概率测度与一般意义上的测度(包括类似面积或体积等概念)的区别在于,概率测度之于整个概