经验风险最小化

✍ dations ◷ 2025-11-20 01:54:42 #机器学习

经验风险最小化 (ERM)是统计学习理论里的一项原则,该原则下有一系列学习算法 ,经验风险最小化用于为这些算法的性能提供理论上的界。核心思想是我们无法确切知道算法在实际中的运行情况(真正的“风险”),因为我们不知道算法将在其上运行的数据的真实分布,但我们可以在一组已知的训练数据(“经验”风险)上衡量其性能。

以下情况是许多有监督学习问题的一般设置。我们有两个空间,输入空间 X {\displaystyle X} ),这个函数在给定 x X {\displaystyle x\in X}   ( x 1 , y 1 ) , , ( x n , y n ) {\displaystyle \ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})}

经验风险最小化原理指出学习算法应选择一个假设 h ^ {\displaystyle {\hat {h}}} 将经验风险降到最低:

因此,由ERM原理定义的学习算法在于解决上述优化问题。

对于具有0-1损失函数的分类问题,即使对于像线性分类器这样的相对简单的函数类,经验风险最小化也被认为是NP难题。 但是,当最小经验风险为零(即数据是线性可分离的)时,可以有效解决。

在实践中,机器学习算法可以通过对0-1损失函数(例如SVM的 铰链损失 )采用凸近似来解决该问题,这种方法更容易优化,或者对分布进行假设 P ( x , y ) {\displaystyle P(x,y)} (因此不再是上述结果适用的不可知论学习算法)。

相关

  • 1900年1900年美国人口普查(英语:1900 United States Census)是美国历史上第12次全国人口普查,确定了美国的常住人口为75,994,575人,相比1890年美国人口普查,同比增长为21.0%。1900年的人
  • 打印机打印机是电脑输出设备的一种,可以将电脑内储存的资料按照文字或影像的方式永久的输出到纸张、透明胶片或其他平面媒介上。单色打印机只能包含一种颜色的图片,通常是黑色,有些单
  • 指挥指挥可以指:
  • 草莓状宫颈草莓状宫颈(strawberry cervix),是指一类身体检查中发现子宫颈中有小点和乳头状成像。它的命名也是因为其成像和草莓外表类似。和子宫颈炎中检查到更多发炎情况不同,草莓状宫颈
  • 麦茶大麦茶,又称为麦茶,日本称麦茶,是流行于东亚的一种茶饮料。大麦茶在欧美也作为咖啡的替代饮品。大麦茶是将大麦焙煎,再磨成粉末而制成的饮料。日本昭和前期称这种饮料为麦汤,意指
  • 1960年代非洲从殖民主义到独立的转变,被称为非洲的非殖民化急剧加速的十年时代,在1960年和1968年之间,共有32个国家独立。意味着欧洲殖民帝国统治非洲大陆的结束,然而,这些新国家的崇高愿
  • 啼死鸟《啼死鸟》()是英国犯罪作家莫·海德(Mo Hayder) 的第一本小说。1999年发行,剧情是介绍了主角 DI Jack Caffery。续集是《治疗》()。
  • 图像分析图像分析(image analysis)和图像处理(image processing)关系密切,两者有一定程度的交叉,但是又有所不同。图像处理侧重于信号处理方面的研究,比如图像对比度的调节、图像编码、去噪
  • 招起陞招起陞(1851年-?年)广州驻防正黄旗汉军全福佐领下人,光绪二十四年(1898年)戊戌科翻译进士。
  • SPDR富时麦格理环球基建100ETFSPDR富时麦格理环球基建100ETF(英语:SPDR FTSE/Macquarie Global Infrastructure 100 ETF)(NYSE:GII),现时由美国道富环球管理基金,其实是根据富时麦格理环球基建100指数走势作标准