经验风险最小化

✍ dations ◷ 2025-11-24 05:56:37 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 组蛋白修饰组蛋白(英语:histone)是真核生物体细胞染色质与原核细胞中的碱性蛋白质,和DNA共同组成核小体结构。它们是染色质的主要蛋白质组分,作为DNA缠绕的线轴,并在基因调控(英语:Regulation
  • 逍遥园逍遥园位在台湾高雄市新兴区,过去是日本佛教净土真宗本愿寺派(西本愿寺)第22代门主大谷光瑞的别墅,于2010年1月26日公告为历史建筑。目前该建筑物属于“行仁新村”之眷舍,因年久
  • 蛇河谷斯内克河(英语:Snake River,也译作蛇河),是美国西北部一条主要河流,也是哥伦比亚河最大的支流。斯内克河发源于怀俄明州黄石公园附近,向西流经斯内克河峡谷进入爱达荷州。由东向西
  • 贾特拉帕蒂·希瓦吉国际机场民用贾特拉帕蒂·希瓦吉·马哈拉杰国际机场(马拉提语:छत्रपती शिवाजी महाराज आंतरराष्ट्रीय विमानतळ,印地语:छत्रपति शिवा
  • 财富500强财富美国500强(英语:Fortune 500),是指美国《财富》杂志每年评选的全美最大的500家公司的排行榜,以公司的营业额为排名。 第一期美国财富500强评选于1955年。
  • 韦特伦韦特伦(荷兰语:Wetteren)是位于比利时东佛兰德省部的一座城市,人口23,209人(2006年)。
  • 美国诉里昂案美国诉里昂案,United States v. Leon,468 U.S. 897 (1984),是美国宪法、美国刑事诉讼法的著名案例,法院创设“善意例外”,警察的行动若系对无效搜索票的善意信赖,证据排除法则不应
  • 保罗·克鲁岑保罗·约泽夫·克鲁岑 (Paul Jozef Crutzen,1933年12月3日-),荷兰大气化学家,因“他们对大气化学的研究工作,特别是臭氧的形成与分解”,与马里奥·莫利纳、弗兰克·舍伍德·罗兰共同
  • 橡树岭 (田纳西州)橡树岭(Oak Ridge)是美国田纳西州安德森县和罗恩县的一座城市,人口约2.7万(2000年)。能源部的橡树岭国家实验室位于此市。
  • Berryz公寓9阶《Berryz公寓9阶》(Berryzマンション9階)是日本的女子偶像组合Berryz工房的第8张原创专辑,于2013年1月30日发行。唱片公司为PICCOLO TOWN。