经验风险最小化

✍ dations ◷ 2025-12-11 10:09:03 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 尿毒症性心包炎尿毒症性心包炎(Uremic pericarditis)是一种心包炎病症形式。它会导致纤维素性心包炎。其病因知之甚少。尿毒症性心包炎相关联于系统中的氮质血症(Azotemia)程度。BUN通常>6
  • 过氧化物过氧化物,指一类含有过氧基-O-O-的化合物,具有强氧化性,又可分为有机过氧化物与无机过氧化物。在包含过氧基的化合物中,每个氧原子的氧化数为 -1。1798年德国科学家亚历山大·冯·
  • 第二型错误第一型及第二型错误(英语:Type I error & Type II error)或型一错误及型二错误为统计学中推论统计学的名词。在假设检验中,有一种假设称为“零假设(虚无假设)”;假设检验的目的是利
  • 大正大正(日语:大正/たいしょう Taishō */?)是日本大正天皇在位期间使用的年号,使用时间从1912年7月30日至1926年12月25日止。承续年号为明治,接续年号为昭和。 大正天皇体弱多病,这
  • 澳大利亚板块澳洲板块是南半球一个主要板块,原为冈瓦那大陆的一部分,直到大约1亿年前,因印度板块开始向北移动,澳洲板块才与印度板块、南极洲板块相连。8500万年前,澳洲板块开始与南极洲板块
  • 氦二聚体氦二聚体是一种由范德华力键合的化合物,化学式He2。它包含了2个氦原子。 它是最大的双原子分子,有5200皮米大。(上图所示)。氦二聚体的键能非常弱,只要分子一旋转或震动到一定程
  • 布罗克顿 (马萨诸塞州)布罗克顿(英语:Brockton)位于美国马萨诸塞州东南部,是普利茅斯县的县治所在,面积55.9平方公里。根据2010年美国人口普查,共有93,810人,其中白人占46.7%、非裔美国人占31.2%、亚裔美
  • 纳流体纳流体(英语:Nanofluid)是指包含纳米颗粒的流体。这些纳米颗粒的材料通常是金属、氧化物、碳化物、或是碳纳米管等,而基液则通常是水、乙二醇和油等。
  • 巴基斯坦伊斯兰教伊斯兰教,巴基斯坦的国教。穆斯林占大约96%的人口(1998年人口普查)。巴基斯坦的穆斯林人数在世界上排名第二,仅次于印尼。91%的巴基斯坦人逊尼派,5%人口什叶派(数字介于17万至30万)
  • 小凯撒 (电影)《小凯撒》(英语:,港台译《小霸王》)是一部1931年的美国前编号时代(英语:Pre-Code Hollywood)犯罪电影,由茂文·勒鲁瓦导演,爱德华·罗宾逊、格兰达·法雷尔(英语:Glenda Farrell)和道格