离散程度

✍ dations ◷ 2025-11-27 00:52:27 #离散程度
在统计学里,离散程度(英语:statistical dispersion)或变差(英语:variation)是指一个分布或随机变量的压缩和拉伸的程度。习惯上,离散程度更多地用来描述分布,而变差更多地用来描述随机变量。用以描述离散程度或变差的量主要有方差、标准差、变差系数和四分位距等。离散程度与集中趋势相对。衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或者秒,则这些量的单位也是米或者秒。这些量举例如下:此外,也有一些无量纲量:另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。假设有随机变量 X {displaystyle mathbf {X} } 及其服从的真实分布 X ∼ D {displaystyle mathbf {X} sim D} 。则对于该随机变量的观测值,可计算其变差(以方差表示) SS total := Var ( X ) {displaystyle {text{SS}}_{text{total}}:={text{Var}}(mathbf {X} )} ;对于分布,亦可计算其变差 SS distribution := Var ( D ) {displaystyle {text{SS}}_{text{distribution}}:={text{Var}}(D)} 。则 SS distribution {displaystyle {text{SS}}_{text{distribution}}} 是相对该随机变量的可解释变差(英语:explainable variation),其余的部分则是不可解释变差(英语:unexplainable variation)。为了衡量不可解释变差,可引入不可解释变差分数(英语:fraction of unexplainable variation) FUV := 1 − SS distribution SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{distribution}}}{{text{SS}}_{text{total}}}}} 。不可解释变差亦称为统计噪声。假设 D ′ {displaystyle D'} 是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器变差(以方差表示) SS model := Var ( D ′ ) {displaystyle {text{SS}}_{text{model}}:={text{Var}}(D')} 。则 SS model {displaystyle {text{SS}}_{text{model}}} 是该模型相对该随机变量的已解释变差(英语:explained variation),其余部分则是未解释变差(英语:unexplained variation)。同样,为了衡量未解释变差,可引入未解释变差分数(英语:fraction of unexplained variation) FUV := 1 − SS model SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{model}}}{{text{SS}}_{text{total}}}}} 。

相关

  • 布尼亚病毒目沙状病毒科 汉他病毒科 内罗毕病毒科(英语:Nairoviridae) 番茄斑萎病病毒科(英语:Tospoviridae) Phenuiviridae(英语:Phenuiviridae)本雅病毒目(Bunyavirales),又译为布尼亚病毒目,属于有
  • 特殊性发育障碍特殊性发育障碍是一类特殊的学习障碍和相关的发育障碍。第十版国际疾病与相关健康问题统计分类(ICD-10) 把特殊性发育障碍分为四类:特殊性语言发育障碍,特殊性学习能力发育障碍,
  • 申克氏孢子丝菌申克氏孢子丝菌(学名:Sporothrix schenckii)是孢子丝菌属的一种真菌,分布于全球,常见于土壤与腐烂的植物组织中。本种真菌可感染人类,造成称为孢子丝菌症(玫瑰园丁症)的皮下感染,感染
  • 最佳可行控制技术最佳可行控制技术(Best available control technology,简称BACT)是美国1990年净化空气法案(英语:Clean Air Act of 1990)中授权使用的污染控制标准。美国国家环境保护局决定哪些污
  • 哺乳哺乳是指雌性哺乳动物通过乳腺分泌的乳汁给后代的幼体喂食的行为,在人类的场合此过程称为母乳喂养。无论时期有多久远,只要是哺乳动物的雌性都具有这种特性,无一例外。乳汁分泌
  • 解释解释(explanation)是对事物的现象、过程、状态、道理等进行描述,以说明其含义、原因、理由等。这样的描述可能是建立在一定规则(如逻辑推理、科学分析)、法律基础之上的。解释也
  • 消费者消费者(英文:Consumer),指任何使用经济里产生的商品和服务的个人或组织。在经济体系中,消费者是在决定交易与否中表现的效用。消费者指支付消费品和服务的人。因此,消费者在一个国
  • 癌症列表这是一个“癌症种类”的列表,表中的癌症以英文名称的第一个字母排序。
  • .mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:
  • 魔法师的外甥《魔法师的外甥》(英语:The Magician's Nephew),又称“纳尼亚前传”,是一部儿童幻想小说,作者是C·S·路易斯。这本书是《纳尼亚传奇》故事中第六个出版的,不过在故事中的时间轴上