离散程度

✍ dations ◷ 2025-12-11 02:13:59 #离散程度
在统计学里,离散程度(英语:statistical dispersion)或变差(英语:variation)是指一个分布或随机变量的压缩和拉伸的程度。习惯上,离散程度更多地用来描述分布,而变差更多地用来描述随机变量。用以描述离散程度或变差的量主要有方差、标准差、变差系数和四分位距等。离散程度与集中趋势相对。衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或者秒,则这些量的单位也是米或者秒。这些量举例如下:此外,也有一些无量纲量:另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。假设有随机变量 X {displaystyle mathbf {X} } 及其服从的真实分布 X ∼ D {displaystyle mathbf {X} sim D} 。则对于该随机变量的观测值,可计算其变差(以方差表示) SS total := Var ( X ) {displaystyle {text{SS}}_{text{total}}:={text{Var}}(mathbf {X} )} ;对于分布,亦可计算其变差 SS distribution := Var ( D ) {displaystyle {text{SS}}_{text{distribution}}:={text{Var}}(D)} 。则 SS distribution {displaystyle {text{SS}}_{text{distribution}}} 是相对该随机变量的可解释变差(英语:explainable variation),其余的部分则是不可解释变差(英语:unexplainable variation)。为了衡量不可解释变差,可引入不可解释变差分数(英语:fraction of unexplainable variation) FUV := 1 − SS distribution SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{distribution}}}{{text{SS}}_{text{total}}}}} 。不可解释变差亦称为统计噪声。假设 D ′ {displaystyle D'} 是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器变差(以方差表示) SS model := Var ( D ′ ) {displaystyle {text{SS}}_{text{model}}:={text{Var}}(D')} 。则 SS model {displaystyle {text{SS}}_{text{model}}} 是该模型相对该随机变量的已解释变差(英语:explained variation),其余部分则是未解释变差(英语:unexplained variation)。同样,为了衡量未解释变差,可引入未解释变差分数(英语:fraction of unexplained variation) FUV := 1 − SS model SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{model}}}{{text{SS}}_{text{total}}}}} 。

相关

  • 恙虫东方体恙虫病东方体(Orientia tsutsugamushi)是恙虫病的病原体。其种小名“tsutsugamushi”源自于日语“つつがむし”,为日本汉字“恙虫”和“病”两字的发音。恙虫东方体的自然病媒
  • 神经毒性神经毒素是以神经系统为靶系统的毒性物质,其主要特征是干扰神经系统功能,产生相应的中毒体征和症状,严重时可致命。神经性毒剂一般指人工合成的神经毒物,大多数为有机磷化合物,与
  • 信息经济信息经济是一个松散的名词,用来描述随着信息活动和信息产业增加的一种经济。当前并没有关于信息经济的共同定义。这是由于事实上研究者只关心部分信息活动的增加,而不是它有无
  • 国民保健署国民医疗服务体系(英语:National Health Service,简称NHS),是对英国以下四大公型医疗系统的统称:国民医疗服务体系的经费主要来自全国中央税收,用以向公众提供一系列的医疗保健服务
  • 采样在信号处理领域,采样是将信号从连续时间域上的模拟信号转换到离散时间域上的离散信号的过程,以采样器实现。通常采样与量化联合进行,模拟信号先由采样器按照一定时间间隔采样获
  • 彩蛋复活节彩蛋是西方国家在庆祝复活节时特别装饰性的蛋。传统上一般是使用经过染色的蛋类。现代的习惯通常是使用蛋状的巧克力代替。彩蛋一般事先藏好,然后由儿童来找寻。是复活
  • 路易士·阿格西让·路易士·鲁道夫·阿格西(法语:Jean Louis Rodolphe Agassiz,1807年5月28日-1873年12月14日),19世纪瑞士裔植物学家、动物学家和地质学家,以冰川理论闻名。阿格西生于瑞士西部,分
  • 浪漫主义音乐浪漫时期的音乐是维也纳古典乐派的延续和发展,是西方音乐史上的一种音乐风格或者一个时代。浪漫主义主要用于描述1830年—1850年间的文学创作,以及1820年—1900年间的音乐创作
  • 德塞夫勒省德塞夫勒省(法语:Deux-Sèvres)是法国新阿基坦大区所辖的省份。该省编号为79。省会为尼奥尔。省名的意思是“双塞夫尔”,指的是两条名为塞夫尔(Sèvre)的河流:南特塞夫尔河(Sèvre N
  • 纳米晶体纳米晶体指晶粒为纳米尺寸的晶体材料,或具有晶体结构的纳米颗粒。一般晶粒尺寸小于100nm的材料才称为纳米晶体。纳米晶体具有很重要的研究价值。纳米晶体的电学和热力学性质