经验风险最小化

✍ dations ◷ 2025-04-04 11:06:29 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 德谟克利特德谟克利特(希腊语:Δημόκριτος ,前460年—前370年或前356年,英语:Democritus)来自古希腊爱琴海北部海岸的自然派哲学家。德谟克利特是经验的自然科学家和第一个百科全书
  • 地球化学地球化学是使用化学原理和工具来解释主要地质系统,如地壳及其海洋背后机制的科学。地球化学领域扩展到了地球以外,涵盖整个太阳系,并且对于一些过程的理解做出了重要贡献,包括地
  • 突厥突厥(土耳其语:Türk;维吾尔语:تۈرك / Türk),是生活在欧亚大陆,使用突厥语族语言的民族群体,狭义的突厥人专指曾建立突厥汗国那部分古突厥人(即以阿史那部落为核心的部落联盟);广
  • 三峡坐标:24°56′04″N 121°22′08″E / 24.9343387°N 121.368905°E / 24.9343387; 121.368905三峡区,原名为三角涌(罗马拼音Sann-kak-íng)为台湾新北市的市辖区之一,位于台北盆
  • 薮猫属薮猫(学名:Leptailurus serval)是产于非洲的中型猫科动物,为薮猫属的唯一成员。薮猫体长85厘米,尾长40厘米。平均寿命在12-20年。与其他猫科动物相比,它体型修长,腿长而尾短,耳朵又
  • 米厘米厘可以指:
  • 水的数据此页面给出水的性质的补充数据。除非另有说明,否则数据均在标准状况测得。88.00(0 °C) 86.04(5 °C) 84.11(10 °C) 82.22(15 °C) 80.36(20 °C) 78.54(25 °C) 76.75(30 °C) 75.
  • 欧洲研究欧洲研究是关于欧洲一体化各个不同领域发展的学科。在世界范围内成为了一门新兴的人文科学。有一些相关的教育提供主要关于欧盟发展的过程。这些学科通常是交叉学科,即有政治
  • autores.uyautores.uy是一个关于作者的在线数据库。由知识共享(CC)的乌拉圭部门创建及维护。该数据库得到了乌拉圭国家图书馆,乌拉圭立法权力图书馆(西班牙语:Biblioteca del Poder Legisla
  • 埃加尔斯·什克莱埃加尔斯·什克莱(拉脱维亚语:Aigars Šķēle,1992年12月4日-),拉脱维亚篮球运动员,现在效力于拉脱维亚球队BK Valmiera。他也代表拉脱维亚国家男子篮球队参赛。