经验风险最小化

✍ dations ◷ 2025-12-08 03:55:47 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 磷脂酰胆碱磷脂酰胆碱是带有胆碱头基的磷脂。磷脂酰胆碱是生物膜的主要成分;通过机械加工或己烷萃取等方法可从蛋黄、大豆等来源中提取磷脂酰胆碱。磷脂酰胆碱属于卵磷脂的一种。二棕榈
  • 萨延बाप तहसील घंटियाली 城镇萨延(Sayan),是印度古吉拉特邦Surat县的一个城镇。总人口12856(2001年)。该地2001年总人口12856人,其中男性7258人,女性5598人;0—6岁人口
  • 心理史学心理史学是从心理学角度思考历史人物行为对历史事件影响的规律,作用是研究在历史上发生的重大事件里,背后所引起的心理从而激励后来人心理作用的研究。这种研究从人物精神分析
  • 第7步兵师第7步兵师(英语:7th Infantry Division)是美国陆军的师级单位,但只有保留师部对其下辖单位进行行政管理,没有作战指挥权。第7步兵师在太平洋战争以及韩战中扮演重要角色。第7步
  • MARC马里兰區域通勤铁路 (Maryland Area Regional Commuter,MARC), 在1984年以前称为马里兰通勤铁路(Maryland Rail Commuter),是巴尔的摩-华盛顿都会区的通勤铁路系统,共有三条路线。
  • 瓦通紙瓦通纸(英语:Corrugated Fiberboard;又称瓦楞纸、纸皮)是纸质包装箱常见的用料,比木箱质轻,又有硬度,大小容易剪裁,保护包装的其他产品,不受损害。而且瓦通纸可在外部印刷不同色彩图
  • 顾梅圣上海交大医学院(原上海第二医科大学)法语培训中心创始人。1987-1996担任中心主任、曾兼任二医大外语系主任。1990年获法国学术棕榈勋位团二级勋章。
  • 1073年教宗选举1073年教宗选举是教宗亚历山大二世于1073年4月21日离世后举行的教宗选举,选举于4月22日开始,并于同日选出希尔德布兰德枢机为教宗额我略七世。根据尼古拉二世于1059年发布的教
  • 新沼谦治新沼谦治(にいぬま けんじ,1956年2月27日-),本名同,是日本的演歌歌手、演员、电视人,出生于岩手县大船渡市。血型A型。
  • 菲海雷纳纳河坐标:23°18′35″S 43°37′50″E / 23.30972°S 43.63056°E / -23.30972; 43.63056菲海雷纳纳河(马达加斯加语:Fiherenana),是马达加斯加的河流,位于该国南部,由阿齐莫-安德列发