经验风险最小化

✍ dations ◷ 2025-12-07 07:54:15 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 牛仔裤牛仔裤是裤子的一种,于19世纪由美国人雅各布·W·戴维斯同巴伐利亚裔美国籍李维·斯特劳斯发明并开始生产。1850年代末期,李维·斯特劳斯来到美国旧金山。他原来是位布商,随身
  • 次黄嘌呤次黄嘌呤(英语:Hypoxanthine)也称“6-羟基嘌呤”,是一种天然存在的嘌呤衍生物。它的核苷酸肌苷酸是核酸的嘌呤核苷酸的合成前体。黄嘌呤是次黄嘌呤被黄嘌呤氧化酶氧化的产物之一
  • 江西填湖广江西填湖广,是指大量江西人迁居到湖广(今湖南与湖北两省范围)的一次大规模移民拓垦活动,影响十分深远。共有两次,一次是发生在明初,另一次是明末清初。明朝驱逐蒙古人后,为了巩固新
  • 中国特色社会主义经济建设协同创新中心中国特色社会主义经济建设协同创新中心是根据2011计划,由南开大学、南京大学、中国人民大学、中国社会科学院经济学部与国家统计局统计科学研究所等协同单位合作建立的非法人
  • 克里斯托弗·哥伦布克里斯托弗·哥伦布(西班牙语:Cristóbal Colón;意大利语:Cristoforo Colombo;1451年-1506年5月20日)是探险家、殖民者、航海家,出生于中世纪的热那亚共和国(今意大利西北部)。在西班
  • 沃纳·福斯曼沃纳·福斯曼(Werner Forßmann,1904年8月29日-1979年6月1日)是一位德国医生,他可以说是心脏导管的发明人。1956年他与安德烈·弗雷德里克·考南德和迪金森·伍德拉夫·理查兹一
  • 金属量金属量是天文学和物理宇宙学中的一个术语,它是指恒星之内除了氢和氦元素之外,其他的化学元素所占的比例(这个术语不同于一般所认知的“金属”,因为在宇宙中氢和氦的组成量占了压
  • 多边形数多边形数是可以排成正多边形的整数。古代数学家发现某些数目的豆子或珠子可以排成正多边形。例如10可以排成三角形:但它不能排成正方形,而9则可以:有些数既可排成三角形,又可排
  • .hn.hn为洪都拉斯国家及地区顶级域(ccTLD)的域名。A .ac .ad .ae .af .ag .ai .al .am .ao .aq .ar .as .at .au .aw .ax .az  B .ba .bb .bd .be .bf .bg .bh .bi .bj .bm .
  • 德奥拉利普拉瓦拉德奥拉利普拉瓦拉(Deolali Pravara),是印度马哈拉施特拉邦Ahmadnagar县的一个城镇。总人口30334(2001年)。该地2001年总人口30334人,其中男性15763人,女性14571人;0—6岁人口3755人,