经验风险最小化

✍ dations ◷ 2025-10-08 00:11:52 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • (叙利亚)马里马里(英语:Mari,即现在叙利亚境内的特尔·哈利利(Tell Hariri))是古代苏美尔亚摩利人建立的城邦,位于幼发拉底河中流的西岸。位于现在叙利亚的阿布·卡马尔西北部11km处,代尔祖尔东
  • 云雀工作室云雀工作室(日语:スタジオ雲雀)是日本的动画制作公司。1979年,原属东映动画的光延博爱与光延幸子夫妇创立云雀工作室,专门动画上色。最早以承包龙之子的作画、上色、演出等业务起
  • 阿里山坐标:23°31′N 120°48′E / 23.517°N 120.800°E / 23.517; 120.800阿里山国家风景区位于台湾嘉义县东部,是由交通部观光局规划与管理的一座国家级风景特定区,设立于2001年
  • 普雷佩查语普雷佩查语(P'urhépecha )又称塔拉斯卡语,是分布于墨西哥米却肯州的美洲原住民语言,属于孤立语言。普雷佩查语是中美洲古国塔拉斯卡王国的主要语言,该国的主要民族是普雷佩查人
  • 永徽之治永徽之治是中国唐高宗李治统治前期所出现的盛世。唐高宗在位初期以永徽作为年号,李治继承其父唐太宗李世民的各项政治措施,发展经济、提倡文教、征服外敌、扩张版图,使得天下大
  • CFM国际LEAPCFM国际LEAP发动机为一高涵道比的涡扇发动机。此一型发动机目前正由美法合资的CFM国际公司所研发,使用于空中客车A320neo、波音737MAX与中国商飞C919之上。LEAP发动机整合了
  • 数字前缀数字前缀 (英语:Numeral prefix) 是派生于数词或其他数字的前缀。在英语和其他欧洲语言,这些前缀用来造一系列包含表示数量信息的词。数字前缀有拉丁语、希腊语、梵语三种,但主要
  • 托马斯·戈尔德 (天文学家)托马斯·戈尔德(英语:Thomas Gold,1920年5月22日-2004年6月22日)是一位生于奥地利的天文物理学家,他曾担任康乃尔大学天文学教授、美国国家科学院院士、皇家学会院士。戈尔德是195
  • 贺麟贺麟(1902年9月20日-1992年9月23日),字自昭,男,四川金堂人,中国近现代哲学家、教育家、翻译家。1919年至1926年就读于北京清华学校。贺麟建立了“新心学”哲学体系,是中国新儒家的代
  • 刚毛藻目刚毛藻目是绿藻中的一个目,属于绿藻门石莼纲。