经验风险最小化

✍ dations ◷ 2025-12-05 07:06:18 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 中关村坐标:39°59′00″N 116°18′56″E / 39.983246°N 116.315509°E / 39.983246; 116.315509中关村科技园区,又称中关村国家自主创新示范区,简称中关村,是中华人民共和国高新技
  • 墨西哥湾流墨西哥湾流,简称湾流(英语:Gulf stream),是大西洋上重要的洋流,以及全球最大的洋流。起源于墨西哥湾,经过佛罗里达海峡沿着美国的东部海域与加拿大纽芬兰省向北,最后跨越北大西洋通
  • 乱卷云乱卷云(学名:Cirrus intortus ,缩写: Ci in ),是卷云的一个变种。乱卷云的云丝弯曲得相当地无序,看上去以不规则的方式相互缠绕在一起。乱卷云是卷云特有的变种。
  • 扶余国扶余国,古国名,亦作夫余、凫臾,由中国东北地区的古老民族扶余人所建立的国家,亦是中国东北地区第一个有史可考的国家。扶余国从前2世纪立国到494年东扶余国被高句丽灭国为止,历时
  • 挪动门柱歧义谬误是由于语言歧义导致无效推理的现象,是一种言词谬误。歧义是一个字词或语句可理解为多种意思的现象。歧义容易造成误解与误会,比如某甲用某语句想表达 A 意思,某乙却理
  • 海虾养殖海虾养殖是水产养殖的一形式,以放养具经济价值的虾类为主。商业海虾养殖场开始于20世纪70年代,饲养海虾以供人食用。海虾生产量急剧增长以满足市场的需求──尤其是美国、日本
  • 战友《战友》(韩语:전우;英语:Comrades/Legend of the Patriots)是韩国KBS电视台于2010年6月19日起播出的大河连续剧,该剧是1975年的重拍版本,亦是纪念韩战爆发60周年的电视剧。由崔秀宗
  • 环西自行车赛环西自行车赛(Vuelta a España),是一项在西班牙举办的公路自行车比赛,为三大自行车赛之一。环西自行车赛为期3周。环西自行车赛首次举办于1935年,主要是受到环法自行车赛、环义
  • 凯里·伊卜尼·嘉马鲁丁凯里·伊卜尼·嘉马鲁丁(马来语:Khairy Jamaluddin;1976年1月10日-),马来西亚从政者,为巫统党员。自2008年马来西亚大选以来代表国民阵线当选为森美兰林茂的国会议员。2018年马来西
  • 白云母白云母(英语:muscovite mica)为硅酸盐矿物的一种。化学式为KAl2(AlSi3O10)(F,OH)2,晶体结构为单斜晶系。它具有各向异性,可产生强双折射现象。白云母是最常见的云母,可见于花岗岩