经验风险最小化

✍ dations ◷ 2025-04-02 17:23:47 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 香槟香槟可指注意在法语中,香槟酒是阳性名词,用作地方名时则是阴性。
  • 轮胎轮胎,通常由橡胶制成,是一种沿圆周覆盖金属或木头轮圈的元件。它是陆地上动力机械车辆最重要的一部分,用于搭载机械或汽车使之移动,并减少不规则路面造成的震荡。1845年,苏格兰人
  • 键线式键线式(英语:Skeletal formula),也称骨架式、拓扑式、折线简式,是在纸面表示分子结构的最常用的方法,在表示有机化合物的立体结构时尤其常用。用键线式表示的结构简明易懂,并且容易
  • FHIR快捷式健康照护互操作性资源(Fast Healthcare Interoperability Resources,FHIR,缩写读音同“Fire”)是一项标准草案,描述的是用于交换电子病历(Electronic health record,EHR)的数
  • 电影胶片电影胶片是专门用于拍摄电影连续活动影象的摄影感光材料的底片,包括电影摄影时使用用的负片、印制直接用于电影放映的拷贝所用的正片、复制用的中间片和录音用的声带片等。这
  • span class=nowrapAgClOsub3/sub/span氯酸银(AgClO3)是白色四方晶体。像所有氯酸盐一样,它可溶于水并在热水中溶解度增加,是强氧化剂。作为一种简单的金属盐,在碱性无机化学实验中,它是一种常见的化学品。对光敏感,必须
  • 乒乓球比赛2008年夏季奥林匹克运动会的乒乓球比赛会由8月13日至8月23日在北京大学体育馆举行,本届奥运的乒乓球赛事共会产生4枚金牌。当中的团体赛中,16支球队会分成4组,每组的首名和次名
  • 键偶极矩键偶极矩是衡量化学键的极性大小的物理量,表示为键矩是向量,方向从正指向负。键矩单位是德拜(D,Debye)或库仑·米(C‧m) 1D= 3.336X10-30C‧m
  • 乙二酰二胺乙二酰二胺又名草酰胺,分子式(CONH2)2,常温下为非常稳定的无色结晶或粉末,可溶于乙醇,微溶于水,不溶于乙醚。乙二酰二胺是草酸的二酰胺衍生物,氰是乙二酰二胺的酸酐。工业上,乙二酰
  • 泽维尔·阿诺桑泽维尔·阿诺桑(Xavier Arnozan,1852年-1928年)是一个传奇的人物,是波尔多市历史上最重要和最具影响力的人士之一。法国医学学士院成员,波尔多副市长,波尔多医院董事,曾获得荣誉勋位