经验风险最小化

✍ dations ◷ 2024-12-23 00:28:55 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 嗜伊红性脑膜炎脑膜炎(英语:meningitis)指发生于脑膜的急性炎症,脑膜是包裹大脑和脊髓的保护薄膜。脑膜炎最常见的症状是发热、头痛和颈部僵硬。其他症状还包含精神错乱(英语:mental confusion)或
  • 补体受体补体受体(英语:complement receptor)是补体系统中的受体,是先天免疫系统的一部分。当有病原体入侵时,可通过抗体或其他途径激活补体蛋白切割为活性形式,再与细胞表面的补体受体结
  • 杜克斯县杜克斯县(英语:Dukes County)是美国马萨诸塞州东南部的一个县,由玛莎葡萄园岛和伊莉莎伯群岛组成。面积1,272平方公里。根据美国2000年人口普查,共有人口14,987人。县治埃德加敦(E
  • 阿道司·赫胥黎奥尔德斯·伦纳德·赫胥黎(英语:Aldous Leonard Huxley,1894年7月26日-1963年11月22日),又译阿道司·赫胥黎,英格兰作家,属于著名的赫胥黎家族。祖父是著名生物学家、演化论支持者托
  • 浪速语浪速语是浪速人的语言,属于缅语支,主要分布在缅甸北部,有10万人使用,云南西部也有3500人使用。浪速人自称“浪峨”,景颇族景颇支系称其为“莫汝”,汉族称其为“浪速”。浪速人在中
  • 何和礼何和礼(满语:ᡥᠣᡥᠣᡵᡳ,转写:Hohori;1561年-1624年),又称何和里、何和哩,明朝文献记载为好好里,董鄂氏人,是清太祖的开国五大臣之一。辽东董鄂(今辽宁桓仁)人。其先祖原姓觉罗氏,从东海
  • 非欧几里得几何非欧几里得几何,简称非欧几何,是多个几何形式系统的统称,与欧几里得几何的差别在于第五公设。古希腊数学家欧几里得的《几何原本》提出了五条公设:长期以来,数学家们发现第五公设
  • 1867年英属北美法令1867年宪法法令(Constitution Act, 1867,原称1867年英属北美法令(The British North America Act, 1867))是英国法律,是加拿大宪法的主要组成部分。该法令规定了加拿大为联邦制度
  • 加勒菲斯绿地加勒菲斯绿地(僧伽罗语:ගාලු මුවදොර පිටිය、泰米尔语:காலிமுகத் திடல்)是斯里兰卡科伦坡的金融和商业区中心沿着印度洋海岸绵延半公里的海滨大道,1
  • 埃马纽埃尔·夏布里埃亚历克西斯-埃马纽埃尔·夏布里埃(法语:Alexis-Emmanuel Chabrier,1841年1月18日-1894年9月13日),法国浪漫主义作曲家。夏布里埃听了瓦格纳的歌剧《特里斯坦与伊索尔德》后,决定放