经验风险最小化

✍ dations ◷ 2025-12-10 08:13:41 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 百济百济(韩语:백제)(前18年-660年),又称南扶余,是古代朝鲜半岛西南部的国家。532年新罗兼并伽倻后,在朝鲜半岛上百济与高句丽、新罗三足鼎立,这段时间被历史学家称为朝鲜三国时代。据《三
  • 美人鱼综合症美人鱼综合症(英语:Sirenomelia 或 Mermaid Syndrome)是一种非常罕见的先天性缺陷,两条腿融合在一起,看起来像“美人鱼”。估计在大约十万个新生儿中会有一例(与连体双胞胎几率相
  • 包立方程式泡利方程或称薛定谔-泡利方程,为描述带有自旋1/2的粒子在与电磁场相互作用下的修正方程(自旋1/2粒子例如电子)。在此之前,用以描述粒子行为的薛定谔方程则未考虑到粒子自旋的性
  • 船政学堂船政学堂,源自1866年(清同治五年)清朝船政大臣沈葆祯于福建福州马尾港所设的海军学院,又称“福建船政学堂”、“福州船政学堂”或“马尾水师学堂”。船政学堂最初称“求是堂艺局
  • 营口县营口市是中华人民共和国辽宁省下辖的地级市,位于辽宁省中南部,地处渤海之滨,辽东湾畔,地理坐标为东经121°56′—123°02′,北纬39°55′—40°56′。为中国八大水系之一的辽河入
  • 南科西嘉省南科西嘉省(法语:Corse-du-Sud;科西嘉语:Pumonti)是法国科西嘉大区所辖的省份。该省编号为2A。 5个海外省及大区
  • 尼泊尔裔俄罗斯人尼泊尔裔俄罗斯人,是指生于俄罗斯的尼泊尔人或有居留权的移民和临时劳工。尼泊尔人来到俄罗斯是在苏联时期,他们来苏联读书和接受训练,大约超过6000位尼泊尔留学生从苏联各大学
  • 战利品行动战利品行动(Operation Plunder)是第二次世界大战末期盟军在1945年3月23日晚上开始的一次行动。这次行动是盟军强渡莱茵河的其中一次行动,目的是要在德国的里斯、威塞尔及利珀运
  • 普实克雅罗斯拉夫·普实克(捷克语:Jaroslav Průšek,1906年-1980年)是捷克汉学家,被认为是汉学布拉格学派的创始人,也是最为杰出的汉学家之一。
  • KMLKML全称:Keyhole Markup Language,是基于XML(eXtensible Markup Language,可扩展标记语言)语法标准的一种标记语言(markup language),采用标记结构,含有嵌套的元素和属性。由Google(