均方根误差

✍ dations ◷ 2025-04-04 11:08:47 #统计学

均方根误差(或称方均根偏移、均方根差、方均根差等,英文:root-mean-square deviation、root-mean-square error、RMSD、RMSE)是一种常用的测量数值之间差异的量度,其数值常为模型预测的量或是被观察到的估计量。方均根偏移代表预测的值和观察到的值之差的样本标准差(sample standard deviation),当这些差值是以资料样本来估计时,他们通常被称为残差;当这些差值不以样本来计算时,通常被称为预测误差(prediction errors)。方均根偏移主要用来聚集预测里头误差的大小,通常是在不同的时间下,以一个量值来表现其预测的能力。方均根偏移是一个好的准度的量度,但因其与数值范围有关,因此被限制只能用来比较不同模型间某个特定变量的预知误差。

均方根误差的定义是估计量 θ ^ {\displaystyle {\hat {\theta }}} θ {\displaystyle \theta } 之差期望值的平方根:

对一个无偏估计量(unbiased estimator)来说,均方根差是方差的平方根,也就是我们所称的标准差。

均方根差的预测值 y ^ t {\displaystyle {\hat {y}}_{t}} 对时间t的回归应变项(dependent variable) y t {\displaystyle y_{t}} 是以n个不同的预测来做为其均方差的平方根:

在某些情况下,均方根差被用来比较两个物品之间的不同(可能没有任一个物品被视为“标准”)。例如,当我们在量测两个时间序列 x 1 , t {\displaystyle x_{1,t}} x 2 , t {\displaystyle x_{2,t}} 时,方均根的式子会变成

正规化的均方根误差可以使得不同数值范围的资料集更易于比较。虽然目前并没有一个一致性的方法来正规化均方根差,但较常用平均值或是资料的范围来正规化被量测的资料。

这个值常被用来指正规化的方均根偏移或误差,同时也常常被表示成比例。当比例的值较低时,代表较少的残差变异。在很多情况下,特别是取较小的样本的时候,样本的范围容易被样本的大小影响,其准确度可能就受到影响。

当以平均值来正规化量测值时,均方根差的变异系数可能被用来避免混淆。这和均方根差在标准差上的变异系数是相同的。

相关

  • 转译翻译(英语:Translation),是蛋白质生物合成(基因表达中的一部分,基因表达还包括转录)过程中的第一步。翻译是根据遗传密码的中心法则,将成熟的信使RNA分子(由DNA通过转录而生成)中“碱
  • 太空航行对人体的影响人类在生理学上能够良好地适应在地球上生存。载人太空航行会对人体产生许多负面影响。最显著之长期影响是肌肉萎缩(英语:muscle atrophy)以及骨骼退化(英语:spaceflight osteopen
  • 美国能源部美国能源部(英语:United States Department of Energy),是美国联邦政府负责能源政策制定,能源行业管理,能源相关技术研发、武器研制等职责的行政部门。美国能源部设美国能源部部长
  • 粲夸克在粒子物理学的标准模型里有六种夸克,粲夸克(Charm quark)是其中一种,其它五种分别为上夸克、下夸克、奇夸克、顶夸克、与底夸克。粲夸克的符号为c。粲夸克的反粒子被称为“反粲
  • 玉米黄质玉米黄素或玉米黄质(Zeaxanthin)是叶黄素的异构体。他是视网膜含有二种类胡萝卜素的其中一种,主要存在于黄斑部分,其他部分则是以叶黄素为主。辣椒粉 (西餐)、玉米和番红花的独
  • 苏格兰英语苏格兰英语(英语:Scottish English),一种英语的变体,在苏格兰使用。最主要的、正式的苏格兰英文,被称为标准苏格兰英语(Standard Scottish English)或苏格兰标准英语(Scottish Standa
  • 大巢鼬大巢鼬(Galictis vittata),又名南美毵鼬,是中美洲及南美洲一种巢鼬属,分布在墨西哥南部至巴西及玻利维亚,栖息在近河流的大草原及雨林。大巢鼬是地盘性及夜间活动的,有时也会在早上
  • NVIDIA GeForce 20系列NVIDIA GeForce RTX 20系列,是由NVIDIA开发的图形处理器系列。本系列于2018年8月20日的Gamescom(科隆游戏展)上发表,是GeForce GTX 10系列的后续版本。本系列首发产品是GeForce
  • 瞿素芬瞿素芬(1953年8月-),女,浙江台州温岭新河镇人。台州市第一位女性市长,曾促成台州成为长三角第16个成员城市。现任浙江省质量技术监督局局长。
  • 中日韩统一表意文字扩展区D中日韩统一表意文字扩展区D(英语:CJK Unified Ideographs Extension D)是一个Unicode区段,在于2010年发布Unicode 6.0中被引入。扩展D区收入222个汉字,编码范围为 U+2B740-U+2B81