经验风险最小化

✍ dations ◷ 2025-11-26 14:22:13 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 四病毒科四病毒科(Tetraviridae)代表种:代表种:
  • 平均动脉压平均动脉压(Mean arterial pressure,简称MAP)为医学上用来描述个体平均血压的词汇,其定义为一个心跳周期(英语:cardiac cycle)中平均的动脉血压。总周边血管阻力(Total Peripheral R
  • 三氯生二氯苯氧氯酚,俗名“三氯生”,又名“三氯新”、“三氯沙”等,化学名为“2,4,4'-三氯-2'-羟基-二苯醚”,英文名为 Triclosan 、 Aquasept、 Gamophen、 Irgasan、 Sapoderm 、 St
  • 真空极化在量子场论里,尤其是量子电动力学,真空极化是一个在背景电磁场中产生电子-正子虚粒子对的过程。产生的虚粒子对会改变原本电荷和电流的分布。有时这被视作规范玻色子(光子)的自
  • 1796年乔治·华盛顿 无党籍约翰·亚当斯 联邦党1796年美国总统选举,是美国第三次的总统选举,由联邦党候选人、时任副总统约翰·亚当斯胜出,对手为前国务卿汤玛斯·杰佛逊。同时,时任
  • 婆罗米系文字婆罗米系文字或印度系文字,是印度孔雀王朝的婆罗米文衍生而来的一种书写系统,属于元音附标文字(Abugida)。其被广泛使用于南亚、东南亚、部分中亚及东亚地区。是目前世界上第四
  • JR九州815系电力动车组JR九州815系电力动车组(日语:815けいでんしゃ),是九州旅客铁道(JR九州)的交流电传动近郊形电车车种之一。1999年10月1日,丰肥本线(熊本~肥后大津)的电化区段通车,815系亦开始投入营运服
  • 2007年世界房车锦标赛荷兰站2007年世界房车锦标赛荷兰站是2007年度世界房车锦标赛的第二站赛事,正式比赛在2007年5月6日于巴西赞佛公园赛道上举行。第一回合由雪佛兰车队的文尼胜出,第二回合由西亚车队的
  • 弗顿·加尔塞斯 (潘普洛纳)弗顿·加尔塞斯(西班牙语:Fortún Garcés,阿拉伯语:فرتون بن غرسية‎,罗马化:,?-约925年后),被称为独眼的(阿拉伯语:باﻻنقر‎, )或是僧侣,从882年到905年为潘普洛纳国王
  • 沮诵沮诵(?-?),或作诅诵、沮颂,是中国神话人物,相传为黄帝史官,负责帮助仓颉创造文字,传说仓颉发明文字,沮诵作为其助手,将之记下来,成功时,鬼神夜间哭泣,认为人类即将变为狡诈。刘知几《史通》