离散程度

✍ dations ◷ 2024-10-06 04:52:08 #离散程度
在统计学里,离散程度(英语:statistical dispersion)或变差(英语:variation)是指一个分布或随机变量的压缩和拉伸的程度。习惯上,离散程度更多地用来描述分布,而变差更多地用来描述随机变量。用以描述离散程度或变差的量主要有方差、标准差、变差系数和四分位距等。离散程度与集中趋势相对。衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或者秒,则这些量的单位也是米或者秒。这些量举例如下:此外,也有一些无量纲量:另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。假设有随机变量 X {displaystyle mathbf {X} } 及其服从的真实分布 X ∼ D {displaystyle mathbf {X} sim D} 。则对于该随机变量的观测值,可计算其变差(以方差表示) SS total := Var ( X ) {displaystyle {text{SS}}_{text{total}}:={text{Var}}(mathbf {X} )} ;对于分布,亦可计算其变差 SS distribution := Var ( D ) {displaystyle {text{SS}}_{text{distribution}}:={text{Var}}(D)} 。则 SS distribution {displaystyle {text{SS}}_{text{distribution}}} 是相对该随机变量的可解释变差(英语:explainable variation),其余的部分则是不可解释变差(英语:unexplainable variation)。为了衡量不可解释变差,可引入不可解释变差分数(英语:fraction of unexplainable variation) FUV := 1 − SS distribution SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{distribution}}}{{text{SS}}_{text{total}}}}} 。不可解释变差亦称为统计噪声。假设 D ′ {displaystyle D'} 是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器变差(以方差表示) SS model := Var ( D ′ ) {displaystyle {text{SS}}_{text{model}}:={text{Var}}(D')} 。则 SS model {displaystyle {text{SS}}_{text{model}}} 是该模型相对该随机变量的已解释变差(英语:explained variation),其余部分则是未解释变差(英语:unexplained variation)。同样,为了衡量未解释变差,可引入未解释变差分数(英语:fraction of unexplained variation) FUV := 1 − SS model SS total {displaystyle {text{FUV}}:=1-{tfrac {{text{SS}}_{text{model}}}{{text{SS}}_{text{total}}}}} 。

相关

  • 感觉减退感觉减退(hypesthesia)是多种医学病症的常见继发效应,表现为体感或感觉减弱,或者感受刺激的部位敏感性部分丧失,俗称麻木。感觉减退主要由神经损伤和血管阻塞引起,进而导致被阻塞
  • 氢离子泵抑制剂质子泵抑制剂(英语:Proton-pump inhibitor、缩写为PPI)或称氢离子帮浦阻断剂,是一种抑制氢离子泵的药物,这种药物对于减少胃酸分泌的作用是显著也长效的,可以说是现今减少胃酸分泌
  • 生命力生命力论(英语:Vitalism,又译为生命主义、生气论、生机论、生机说、生命力)在人类历史上存在长久的历史,现代版本是19世纪初由瑞典化学家贝采利乌斯提出。一般认为“生命力”学说
  • 俄歇电子俄歇电子(Auger electron)是由于原子中的电子被激发而产生的次级电子。当原子内壳层的电子被激发形成一个空洞时,电子从外壳层跃迁到内壳层的空洞并释放出能量;虽然能量有时以光
  • 多洛米蒂山脉多洛米蒂山(拉登语:Dolomites;意大利语:Dolomiti;德语:Dolomiten;弗留利语:Dolomitis)是阿尔卑斯山的一部分,位于意大利东北部三个省,其70%地区位于贝卢诺省,其余位于波尔扎诺自治省和特
  • 土星1号土星1号运载火箭是美国第一枚专门用来将载荷送入地球轨道的运载火箭。美国国家航空航天局共发射了10枚土星1号运载火箭。此后由土星1B号运载火箭所取代。与1号相比1B号拥有
  • 复演说复演说(英语:Recapitulation theory)是一个由德国生物学家恩斯特·海克尔主张的历史上的假说,称动物胚胎的发育过程,从受精到妊娠和孵化(个体发生学)会经历和该动物远古祖先成年个
  • 瓦列里·波利亚科夫瓦列里·弗拉基米罗维奇·波利亚科夫(俄语:Валерий Владимирович Поляков,转写:Valeri Vladimirovich Polyakov,1942年4月27日-),俄罗斯宇航员。1994年1
  • 情夫情夫是已婚女性的男性婚外情人,尤其指被亿万富婆包养的一类,中国古代称面首,又俗称小白脸,主人翁,牛郎, 现在又有二公、二爷、小王的俗称(相当于情妇被称为“二奶”或当今俗称的“
  • 热塑性塑料热塑性塑料(英语:thermoplastic,又译导热塑胶)指具有加热软化、冷却硬化特性的塑料。我们日常生活中使用的大部分塑料属于这个范畴。热塑性聚合物是一种聚合物,指具有加热后软化