经验风险最小化

✍ dations ◷ 2025-04-26 13:10:08 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 乌泰他尼府乌泰他尼府(泰语:จังหวัดอุทัยธานี,皇家转写:Changwat Uthai Thani,泰语发音:),在泰国北部,他的邻府自北顺时针是那空沙旺府、猜纳府、素攀府、北碧府和达府。华人称
  • MillipedeMillipede是一种数据存储于聚合体层上的纳米量级“坑”中的非易失性存储器。这种存储器的读写由基于微机电系统的探针完成。这种存储技术允许每平方英寸上高于1TB的数据存储
  • 酱菜酱菜(又称虀)是用酱腌制保存并调味的蔬菜,现代也有用酱油、虾油等腌制的。另外,日常使用中,“酱菜”一词经常与腌菜混用。
  • 火车铁路列车,简称列车,或称火车,是指在铁路轨道上行驶的车辆,通常由多节车厢所组成,可以载运乘客或是货物。火车的动力来源可以来自个别的铁路机车或是将动力分散到每个车厢的动力分
  • 1,6-己二醇1,6-己二醇(英语:1,6-Hexanediol)是化学式为HO(CH2)6OH的饱和直链二元醇,常温下为无色液体,可溶于水。在工业上,1,6-己二醇可由己二酸或其酯氢化合成。在实验室中通常由氢化铝锂还
  • 澄海坐标:23°28′N 116°45′E / 23.467°N 116.750°E / 23.467; 116.750澄海区(官方音译:Chenghai,传统外文:Tenghai)是中国广东省汕头市的一个市辖区。位于南海之滨的广东东南部,潮
  • 迈杜语迈杜语(Maiduan),也称迈顿语(Maidun)或佩纽蒂安语(Pujunan)是美国加利福尼亚州东北部的一种濒危小语种。迈杜语包括4种语言:该类语言有相似的音韵(即发音),但语法差异较大。各
  • 特雷莎·海因茨·克里特雷莎·海因茨·克里(Maria Teresa Thierstein Simões-Ferreira Heinz Kerry,1938年10月5日-)是美国慈善家,她的丈夫是前美国国务卿约翰·克里。她亦是亨氏创办人亨利·约翰·
  • 书评书评简言之,即是介绍书籍内容,并评论其得失之谓。根据美国《兰登字典》解释:“书评是对于新出版的书加以批判(Critical description)和评价(evaluation),而发表在报纸或杂志者。”而
  • 肯尼思·莱肯尼思·莱(英语:Kenneth Lee "Ken" Lay,1942年4月15日-2006年7月5日)是美国商人,并以其在安隆有限公司丑闻中的角色而著名。在丑闻被披露后,肯尼思·莱和安然更成为了企业丑闻(corp