首页 >
离散程度
✍ dations ◷ 2025-04-02 13:05:25 #离散程度
在统计学里,离散程度(英语:statistical dispersion)或变差(英语:variation)是指一个分布或随机变量的压缩和拉伸的程度。习惯上,离散程度更多地用来描述分布,而变差更多地用来描述随机变量。用以描述离散程度或变差的量主要有方差、标准差、变差系数和四分位距等。离散程度与集中趋势相对。衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或者秒,则这些量的单位也是米或者秒。这些量举例如下:此外,也有一些无量纲量:另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。假设有随机变量
X
{displaystyle mathbf {X} }
及其服从的真实分布
X
∼
D
{displaystyle mathbf {X} sim D}
。则对于该随机变量的观测值,可计算其变差(以方差表示)
SS
total
:=
Var
(
X
)
{displaystyle {text{SS}}_{text{total}}:={text{Var}}(mathbf {X} )}
;对于分布,亦可计算其变差
SS
distribution
:=
Var
(
D
)
{displaystyle {text{SS}}_{text{distribution}}:={text{Var}}(D)}
。则
SS
distribution
{displaystyle {text{SS}}_{text{distribution}}}
是相对该随机变量的可解释变差(英语:explainable variation),其余的部分则是不可解释变差(英语:unexplainable variation)。为了衡量不可解释变差,可引入不可解释变差分数(英语:fraction of unexplainable variation)
FUV
:=
1
−
SS
distribution
SS
total
{displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{distribution}}}{{text{SS}}_{text{total}}}}}
。不可解释变差亦称为统计噪声。假设
D
′
{displaystyle D'}
是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器变差(以方差表示)
SS
model
:=
Var
(
D
′
)
{displaystyle {text{SS}}_{text{model}}:={text{Var}}(D')}
。则
SS
model
{displaystyle {text{SS}}_{text{model}}}
是该模型相对该随机变量的已解释变差(英语:explained variation),其余部分则是未解释变差(英语:unexplained variation)。同样,为了衡量未解释变差,可引入未解释变差分数(英语:fraction of unexplained variation)
FUV
:=
1
−
SS
model
SS
total
{displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{model}}}{{text{SS}}_{text{total}}}}}
。
相关
- 先天性免疫系统先天免疫系统(英语:Innate immunity)又称为非特异性免疫、固有免疫、非专一性防御,包括一系列的细胞及相关机制,可以以非特异性的方式抵御外来感染。先天免疫系统的细胞会非特异
- RNA加工转录后修饰(RNA修饰,或称修饰RNA)是真核细胞中,将初级转录RNA转化为成熟RNA的加工过程。一个很好的例子就是前mRNA转化为成熟的mRNA,其中包括剪接,并发生在蛋白质生物合成之前。这
- 卵巢癌卵巢癌是发源自女性卵巢的癌症,会产生会入侵以及转移到其他部位的异常细胞。卵巢癌初期症状不明显,随病情进展,才会出现许多癌症的典型症状,包括胀气、腹胀、骨盆痛(英语:Pelvic p
- 痳疯杆菌麻风杆菌也称为韩森氏杆菌,是一种可引起麻风病的分支杆菌,菌体呈短小棒状或稍弯曲,长约2-6µm,宽约0.2-0.6µm,抗酸染色呈红色(抗酸性),革兰氏染色呈阳性,好氧菌。于1873年由挪威医生
- 头孢达肟头孢达肟(其国际非专利药品名称为“Cefdaloxime”)是一种第三代头孢菌素。羧基青霉素:羧苄西林(卡茚西林) · 替卡西林 · 替莫西林 脲基青霉素:阿洛西林 · 哌拉西林 ·
- Cn5f14 6d10 7s22, 8, 18, 32, 32, 18, 2第一:1154.9 kJ·mol−1 第二:2170.0 kJ·mol−1 第三:3164.7 kJ·mol−1 (六方密排主条目:[[鎶的同位素]]'鎶'(Copernicium)是一种人工合成
- 等宽字体等宽字体(英语:Monospaced Font)是指字符宽度相同的电脑字体。与此相对,字符宽度不尽相同的电脑字体称为比例字体。在传统西文印刷中,比例字体可以提高单词的可读性。但因打字机
- 古兰经《古兰经》(阿拉伯语:اَلْقُرآن,al-qurʾān,字面上解作“诵读”)是伊斯兰教中最重要的经典。伊斯兰教信徒(穆斯林)相信《古兰经》是真主安拉的启示,它被广泛认为是最优
- 对于犹太人大屠杀的否认庇隆主义 国家工团主义 民族社会主义 民族无政府主义 民族布尔什维克主义纳粹党 前沿交叉 官方全国战线 第三位置组织 新力量 国际第三位置法西斯象征 新法西斯主义 新纳粹
- 陈化兰陈化兰(1969年3月-),甘肃靖远人,中国女兽医学家。她主要关注禽流感疫苗的研制。1991年获甘肃农业大学兽医学士学位,1994年获甘肃农业大学兽医病理专业硕士学位,1997年获中国农业科