经验风险最小化

✍ dations ◷ 2025-08-02 14:24:13 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 自我哲学自我哲学(英语:philosophy of self)是一个经验主体与所有其他的事物区别的身份条件。当代有关自我本性的探讨与人格本性、个人身份相关的讨论有所不同。“自我”一词有时被认为
  • 原结原结是脊椎动物在囊胚于原肠形成所留下的,又可以称为汉森结/亨生结,因为由Victory Hensen所发现;而两生类则被称为史培曼/史佩曼组织,因为是由Han Spemman所发现(在1924年与Mangold
  • 戒律戒可以指:
  • 替身代孕代孕或代理孕母是第三方借代孕母亲怀孕生子的过程。代孕母亲和需求方协议,同意怀孕分娩,产下的婴儿成为代孕需求方的子女。寻求代孕的情形有很多种,可能是需求方的夫妻在医学上
  • 火山喷发类型火山喷发是指火山口或火山裂缝排出熔岩、火山喷发碎屑(火山灰、火山砾、火山弹和火山块)以及各种气体的过程。根据火山学家定义,火山喷发可分为数种类型,通常以该模式中著名的火
  • 第2位广东省各地级市人口列表列出广东省21个地级市历年的常住人口与户籍人口。人口普查年份的常住人口为人口普查数字,非人口普查年份的常住人口为年度人口抽样调查推算数字。户籍
  • 特罗普数额特罗普数额(Droop Quota)是一种用于可转移单票制及比例代表名单投票制中的最大余额方法的数额。只要有关候选人或候选名单每取得数额一倍的票数,便能获分配一个议席。特罗普数
  • 2002年飓风凯尔飓风凯尔(英语:Hurricane Kyle)是有纪录以来持续时间第五长的大西洋热带或亚热带气旋,也是2002年大西洋飓风季第11个获得命名的风暴和第3场飓风,于9月20日由百慕大东南偏东方向的
  • 乳制品用盐乳制品用盐是用来增加食品风味并充当食品防腐剂的一种用于准备黄油和奶酪产品的盐制品。乳制品用盐有着不同的质量和纯度,其中最为纯净的种类可以用来食用。早在1890年代,英格
  • 七冲门饮食从进入人体内到排出体外,共需经过七个主要部位,这七个部位在人体饮食的代谢过程中就如七个关卡,在中医中称作“七冲门”。《难经》中描述这“七冲门”为:口唇是饮食进入人体