首页 >
离散程度
✍ dations ◷ 2025-11-20 00:23:27 #离散程度
在统计学里,离散程度(英语:statistical dispersion)或变差(英语:variation)是指一个分布或随机变量的压缩和拉伸的程度。习惯上,离散程度更多地用来描述分布,而变差更多地用来描述随机变量。用以描述离散程度或变差的量主要有方差、标准差、变差系数和四分位距等。离散程度与集中趋势相对。衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或者秒,则这些量的单位也是米或者秒。这些量举例如下:此外,也有一些无量纲量:另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。假设有随机变量
X
{displaystyle mathbf {X} }
及其服从的真实分布
X
∼
D
{displaystyle mathbf {X} sim D}
。则对于该随机变量的观测值,可计算其变差(以方差表示)
SS
total
:=
Var
(
X
)
{displaystyle {text{SS}}_{text{total}}:={text{Var}}(mathbf {X} )}
;对于分布,亦可计算其变差
SS
distribution
:=
Var
(
D
)
{displaystyle {text{SS}}_{text{distribution}}:={text{Var}}(D)}
。则
SS
distribution
{displaystyle {text{SS}}_{text{distribution}}}
是相对该随机变量的可解释变差(英语:explainable variation),其余的部分则是不可解释变差(英语:unexplainable variation)。为了衡量不可解释变差,可引入不可解释变差分数(英语:fraction of unexplainable variation)
FUV
:=
1
−
SS
distribution
SS
total
{displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{distribution}}}{{text{SS}}_{text{total}}}}}
。不可解释变差亦称为统计噪声。假设
D
′
{displaystyle D'}
是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器变差(以方差表示)
SS
model
:=
Var
(
D
′
)
{displaystyle {text{SS}}_{text{model}}:={text{Var}}(D')}
。则
SS
model
{displaystyle {text{SS}}_{text{model}}}
是该模型相对该随机变量的已解释变差(英语:explained variation),其余部分则是未解释变差(英语:unexplained variation)。同样,为了衡量未解释变差,可引入未解释变差分数(英语:fraction of unexplained variation)
FUV
:=
1
−
SS
model
SS
total
{displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{model}}}{{text{SS}}_{text{total}}}}}
。
相关
- 神经组织神经组织是四大基本组织之一,由神经细胞和神经胶质细胞组成。神经细胞通过突触相连接形成复杂的神经网络,具有感受内外刺激、传导整合信息的能力。神经胶质细胞对神经元起支持
- 表睾酮表睾酮(英语:Epitestosterone)或称为异睾酮,英语:isotestosterone, 17α-睾酮,17α-testosterone,是一种内源性的甾体物质,是雄性性激素睾酮的17α-羟基差向异构体,是一种较弱的雄激素
- 动物志《动物志》(古希腊语:Περὶ Τὰ Ζῷα Ἱστορίαι,拉丁语:Historia Animālium,英语:History of Animals)是一本亚里士多德的动物学自然史著作。一般意义上说,动物志是对
- 离子泵离子泵是真空泵的一种。离子泵的原理是将气体分子电离后,利用强电场将离子加速至电极板处并捕获,以此移除容器内的气体。 理想条件下,离子泵可以产生压强低至10-11毫巴的真空。
- 科塞尔阿尔布雷希特·科塞尔(Ludwig Karl Martin Leonhard Albrecht Kossel,1853年9月16日-1927年7月5日),生于罗斯托克,德国医生。科塞尔的工作范畴是生理化学,特别是组织和细胞的化学。
- 调控序列调控序列(英语:Regulatory sequence,又译调节序列)是生物体内可以促进或抑制基因表达的核酸片段。调控序列可以是DNA中一段包含启动子、增强子、沉默子,以及一些调节蛋白(如转录因
- 马克·普塔什尼马克·普塔什尼(英语:Mark Ptashne,1940年6月5日-),美国分子生物学家和小提琴家。他目前担任纽约的纪念斯隆 - 凯特琳癌症中心分子路德维希生物学主席。1940年出生于芝加哥。他首
- 安东尼奥·加西亚-贝利多安东尼奥·加西亚-贝利多(西班牙语:Antonio García-Bellido,1936年4月30日-),西班牙生物学家。他在发育生物学界极具影响力。
- 花翠素翠雀花素(英文:delphinidin) ,也叫飞燕草素、花翠素,是最常见的花青素之一,既是一种植物色素也是一种抗氧化剂。 翠雀花素在翠雀属和堇菜属植物中的存在导致显现蓝色。它还给了赤
- 葛瑞夫兹氏症弥漫性毒性甲状腺肿(Toxic diffuse goiter),又称格里夫氏症(Graves' disease),为一种主要侵犯甲状腺的自身免疫性疾病。此病为导致甲状腺功能亢进症最常见的原因,且会导致甲状腺肿
