经验风险最小化

✍ dations ◷ 2025-06-08 07:50:51 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 肺结核结核病(Tuberculosis,又称TB)为结核杆菌感染引起的疾病。结核通常造成肺部感染,也会感染身体的其他部分。大多数感染者没有症状,此型态感染称为潜伏结核感染(英语:Latent tuberculo
  • 索哈杰省索哈杰省(阿拉伯语:محافظة سوهاج‎),是埃及二十九省之一,位于上埃及,尼罗河在中间流过。首府索哈杰。面积1,547平方公里,人口3,746,378人(2006年统计)。
  • 教职员教师(英语:Teachers,中文口语也常称作“老师”,旧称“先生”),又称作教育工作者、教员,是大众对教育从业者的称呼,是培养社会所需人才的专业。于教育机构;因应社会需要,亦有家庭教师的
  • Versace詹尼·范思哲公司(英语:Gianni Versace S.p.A,台译为“凡賽斯”)是意大利时装公司,由詹尼·范思哲于1978年创立,詹尼·范思哲逝世后,公司由其妹多纳泰拉·范思哲接手。范思哲的主要
  • 国际科学奥林匹克竞赛国际科学奥林匹克竞赛,又称为国际中学生奥林匹克竞赛,是供全球各地中学生的比赛,一般指由世界各国尚未接受系统的高等教育的中学生参加的学科知识竞赛。学科奥林匹克竞赛竞赛每
  • 乌药乌药(学名:Lindera aggregata),又称作台乌、台乌药、台片、天台乌、天台乌药、乌药片,为樟科山胡椒属下的一个种。天台乌药:中国地理标志产品。产于浙江省天台县。
  • 水灯节水灯节(英语:Loi Krathong,泰语:ลอยกระทง)是泰国、寮国、斯里兰卡, 柬埔寨和缅甸部分地区的传统节日,即每年泰历之十二月十五日(公历11月), 农历每年9月或10月圆月晚.每逢水
  • 口头语口头语,与书面语相对,是口头交际时使用的语言,是最早被人类普遍应用的语言形式。人类各民族都有口头语。口头语通常是通过声音传播的,但有时文学作品中也常以文字记叙口头语。
  • 彼得·库欣彼得·库欣(Peter Wilton Cushing),OBE (1913年5月26日-1994年8月11日),出生于英国萨里的肯利,是英国的一名演员,因演出漢默公司(Hammer Film Productions)的多部作品而出名,其中包括《
  • 磁流体力学磁流体力学(英文:MHD, Magnetohydrodynamics、magnetofluiddynamics或hydromagnetics),是研究等离子体和磁场相互作用的物理学分支,其基本思想是在运动的导电流体中,磁场能够感应