经验风险最小化

✍ dations ◷ 2025-11-13 13:07:13 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 互惠税则法互惠税则法(英语:Reciprocal Tariff Act,1934年6月12日颁布,ch. 474,48 Stat. 943,美国法典第19卷(英语:Title 19 of the United States Code)第1351章)是一部美国国会在1934年颁布
  • 飞米飞米(又称费米,符号fm,英语:femtometer)是长度单位,常用于描述原子级别的物质。1飞米相当于10-15米。人们为了纪念最著名的原子物理学家恩里科·费米,将“费米”作为长度单位名。命
  • 神经纤维瘤病神经纤维瘤病(NF)有三种情况,其肿瘤于神经系统生长。 这三种类型是神经纤维瘤I型(NF1),神经纤维瘤II型(NF2)和神经鞘瘤。 在NF1中症状包括皮肤上的浅褐色斑点、腋窝和腹股沟有斑、神
  • 太医局太医局为中国古代的医疗机构。太医局在秦朝、汉朝时归于少府所管辖,至晋朝时属于宗正所管,而八王之乱后,晋政府南迁,太医局则转为由门下省统领,到了北齐时又于太常之下。 最后在
  • 大伾山大佛大伾山摩崖大佛及石刻位于中国河南省浚县大伾山天宁寺院内及附近,2001年被列为第五批全国重点文物保护单位。天宁寺始建于北魏太和年间,原称大伾山寺,明代改称天宁寺,现有山门、
  • 清华大学建筑学院清华大学建筑学院,为清华大学直属学院,1988年在清华大学建筑系基础上建立。1945年,抗日战争胜利前夕,为了迎接战后复兴的需要,梁思成致书当时清华大学校长梅贻琦,畅叙建筑教育发展
  • 阿蒂德乡坐标:46°27′0″N 25°3′0″E / 46.45000°N 25.05000°E / 46.45000; 25.05000阿蒂德乡(罗马尼亚语:Comuna Atid, Harghita),是罗马尼亚的乡份,位于该国中部,由哈尔吉塔县负责管
  • 秦基博秦基博(日语:秦 基博/はた もとひろ ,1980年10月11日-),日本男性创作歌手,日本环球音乐旗下艺人。生于宫崎县日南市,长于神奈川县横滨市。身高178cm。家中排行老三。已婚。小学二年
  • 玉露炒茶玉露牌炒茶产于浙江省衢县乌溪江,是一款茗茶。品质特点:绿翠鲜活香气高,滋味醇和,茶汤颜色嫩绿明亮,芽叶成朵。
  • 辐射度在辐射度量学当中,辐射度(英语:radiosity)是指通过放射、反射及传递“离开”一个表面的辐射功率的单位计量方式;光谱辐射度(英语:spectral radiosity)则指一个频率或波长表面单位的