离散程度

✍ dations ◷ 2024-11-05 22:52:04 #离散程度
在统计学里,离散程度(英语:statistical dispersion)或变差(英语:variation)是指一个分布或随机变量的压缩和拉伸的程度。习惯上,离散程度更多地用来描述分布,而变差更多地用来描述随机变量。用以描述离散程度或变差的量主要有方差、标准差、变差系数和四分位距等。离散程度与集中趋势相对。衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或者秒,则这些量的单位也是米或者秒。这些量举例如下:此外,也有一些无量纲量:另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。假设有随机变量 X {displaystyle mathbf {X} } 及其服从的真实分布 X ∼ D {displaystyle mathbf {X} sim D} 。则对于该随机变量的观测值,可计算其变差(以方差表示) SS total := Var ( X ) {displaystyle {text{SS}}_{text{total}}:={text{Var}}(mathbf {X} )} ;对于分布,亦可计算其变差 SS distribution := Var ( D ) {displaystyle {text{SS}}_{text{distribution}}:={text{Var}}(D)} 。则 SS distribution {displaystyle {text{SS}}_{text{distribution}}} 是相对该随机变量的可解释变差(英语:explainable variation),其余的部分则是不可解释变差(英语:unexplainable variation)。为了衡量不可解释变差,可引入不可解释变差分数(英语:fraction of unexplainable variation) FUV := 1 − SS distribution SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{distribution}}}{{text{SS}}_{text{total}}}}} 。不可解释变差亦称为统计噪声。假设 D ′ {displaystyle D'} 是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器变差(以方差表示) SS model := Var ( D ′ ) {displaystyle {text{SS}}_{text{model}}:={text{Var}}(D')} 。则 SS model {displaystyle {text{SS}}_{text{model}}} 是该模型相对该随机变量的已解释变差(英语:explained variation),其余部分则是未解释变差(英语:unexplained variation)。同样,为了衡量未解释变差,可引入未解释变差分数(英语:fraction of unexplained variation) FUV := 1 − SS model SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{model}}}{{text{SS}}_{text{total}}}}} 。

相关

  • 地理可视化地理可视化是指将地理空间数据分析并可视化的的一系列方法。就像是科学可视化和信息可视化 一样,地理可视化特别强调知识建构,而非在于知识记忆和信息传达。为了做到这个目标,
  • ROC曲线在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫ROC曲线)是一种坐标图式的分析工具,用于 (1) 选择最佳的信号侦测模型、舍弃次佳的模型。
  • 盲肠盲肠,即阑肠,见于人和羊膜动物。在人体位于腹腔右下部,右中腹长约6到8厘米的大肠起始段结构,形如袋状。盲肠向上延续为升结肠,下部有一孔通阑尾,同回肠交接区的内壁有回盲瓣,有防止
  • 经验主义经验主义(英语:Empiricism)又作经验论,通常指相信现代科学方法,相信证据,着重认为理论应建立于对于事物的观察,而不是直觉或迷信。意即通过实验研究而后进行理论归纳优于单纯的逻辑
  • 加州理工学院加州理工学院(California Institute of Technology,缩写:Caltech)是一所位于美国加利福尼亚州帕萨迪纳的私立研究型大学,创建于1891年,以自然科学及工程学著称,常被评为世界前十的
  • 内体胞内体(英语:Endosome,又称内体)在细胞生物学中指的是一种真核细胞中的膜结合细胞器,属于一种囊泡结构。作为细胞内吞作用中运载途径的一个区室,胞内体从细胞质膜被传递到溶酶体被
  • .cat.cat(加泰罗尼亚语:Català的缩写,加泰罗尼亚语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Co
  • 诉诸言论自由我有权发表意见(I'm entitled to my opinion; I have a right to my opinion)或诉诸言论自由是一种不相干的谬误,是在自己的主张被人反驳时,主张己方有发表意见的权利(或有言论自
  • 美国绿建筑协会美国绿建筑协会(英文:U.S. Green Building Council,缩写:USGBC)是个非营利组织,旨在推动建筑物能够具有永续设计与建造。美国绿建筑协会以推动领先能源与环境设计而著称。转变建筑
  • 国际废除核武器运动国际废除核武器运动(英语:International Campaign to Abolish Nuclear Weapons, ICAN;/ˈaɪkæn/ EYE-kan)为一个全球公民社会联盟,致力于遵守与全力执行《禁止核武器条约》,并在