卡方分布

✍ dations ◷ 2025-04-03 17:03:23 #连续分布,正态分布,指数族分布,无穷可分概率分布,概率分布

卡方分布(chi-square distribution, ²-distribution,或写作²分布)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。

由卡方分布延伸出来皮尔森卡方检定常用于:

若个随机变量、……、是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量的平方和

被称为服从自由度为 的卡方分布,记作

可以在文章右上角的表中看到更多卡方分布的性质。

卡方分布的概率密度函数为:

其中x≥0,当x≤0时 f k ( x ) = 0 {\displaystyle f_{k}(x)=0} 的卡方变量的平均值是,方差是。卡方分布是伽玛分布的一个特例,它的熵为:

其中 ψ ( x ) {\displaystyle \psi (x)} 个随机变量、……、是相互独立,符合标准正态分布的随机变量,则它们与均值之间偏差的平方和

X = i = 1 k ( Z i Z ¯ ) 2 χ k 1 2 {\displaystyle X=\sum _{i=1}^{k}(Z_{i}-{\bar {Z}})^{2}\sim \chi _{k-1}^{2}}

其中均值

Z ¯ = 1 k i = 1 k Z i {\displaystyle {\bar {Z}}={\frac {1}{k}}\sum _{i=1}^{k}Z_{i}}

它的平方正比于自由度为1的卡方分布,即

n Z ¯ 2 χ 1 2 {\displaystyle n{\bar {Z}}^{2}\sim \chi _{1}^{2}}

p-value = 1- p_CDF.

χ2越大,p-value越小,则可信度越高。通常用p=0.05作为阈值,即95%的可信度。

常用的χ2与p-value表如下:

相关

  • 低血钙低钙血症或低血钙症(Hypocalcaemia)系指血清中的钙离子浓度过低的状况,正常比例为 2.1 至 2.6 mmol/L(约为 8.8 到 10.7mg/dl,4.3 到 5.2 mEq/L),如果低于 2.1 mmol/L,就会认定为低
  • 地钱门裸蒴苔纲 Haplomitriopsida叶苔纲 Jungermanniopsida地钱纲 Marchantiopsida地钱是苔藓植物中的一门。和其他的苔藓植物一样,地钱门植物在其生命周期内主要以配子体(细胞内只
  • 贝叶氏谱系分析贝叶氏谱系分析(Bayesian inference of phylogeny)是根据已知的先验几率推导后验几率的似然函数,进而去预测最可能的系谱树。随着电脑计算速度的演进以及马尔科夫-蒙特卡洛法的
  • 逮捕逮捕指以强制力拘束人身自由之强制处分,逮捕之主要目的为预防犯罪或是为进行侦查。逮捕,是指为了防止犯罪嫌疑人或者被告人实施妨碍刑事诉讼的行为,逃避侦查、起诉、审判或者发
  • 越南共产党中央委员会总书记政治主题越南共产党中央委员会总书记(越南语:Tổng Bí thư Ban Chấp hành Trung ương Đảng Cộng sản Việt Nam),1951年至1976年称第一书记(越南语:Bí thư Thứ nhất
  • 中积云中积云(学名:Cumulus mediocris,缩写: Cu med ),是积云的一种。中积云垂直延伸处于淡积云与浓积云间,云顶有较小的隆起或芽状结构。淡积云通常不会带来降水,但其也可能发展成会产生
  • 中华民国 (台湾时期)中华民国 (台湾时期)是指从1949年12月7日至今,中华民国中央政府撤离中国大陆、退守台湾的时期。1142万平方公里(1943-1946年)985万平方公里(1946-1949年)1142万平方公里(1953年至2
  • 许延邵许延邵,浙江湖州武康人,清朝政治人物、进士出身。顺治十五年,登戊戌科进士。康熙十四年,担任江西建昌县知县。后调任星子县知县。康熙三十三年,担任福建泉州府知府。
  • 碳物质无定形碳(Amorphous carbon)一种非结晶质(英语:Crystalline))构造、富含反应性的碳。所谓无定形碳是指其内部结构而言。部分无定形碳的末端可能与氢以悬键(英语:Dangling bond)结合,
  • 17世纪1601年1月1日至1700年12月31日的这一段期间被称为17世纪,也称巴洛克时期。17世纪是殖民主义发展的一个世纪。伏尔泰称17世纪是“路易十四的世纪”。科学史上,怀特海称之为“天