监督学习

✍ dations ◷ 2025-06-18 07:55:01 #机器学习

监督学习(英语:Supervised learning),又叫有监督学习,监督式学习,是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。

监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:

另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。

目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。

监督式学习的目标是在给定一个 (, ())的集合下,去找一个函数。

假设符合行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数

其中,是的陪域,且会对应到非负实数(可能有其它限制)。如果预测出来的值是,但实际值是,而(, )这个量是其间的。

某个函数的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:

现在的目标则是在一堆可能的函数中去找函数*,使其风险(*)是最小的。

然而,既然的行为已知适用于此有限集合(11), ..., nn),则我们可以求得出真实风险的近似值,譬如,其为:

选择会最小化经验风险的函数*就是一般所知的原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?

一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。

相关

  • 抗生素生长促进剂抗生素生长促进剂(antibiotic growth promoters,AGPs)指在畜牧业中,作为非治疗用途使用的抗生素添加剂。20世纪50年代起,抗生素生长促进剂开始在动物生产中应用。2006年起,欧洲禁
  • 道金斯克林顿·理查德·道金斯,FRS, FRSL(英语:Clinton Richard Dawkins,1941年3月26日-),生于内罗毕,英国演化生物学家、动物行为学家、科学传播者、作家,1990年任牛津大学动物学正教授,199
  • 上奥地利上奥地利州(德语:Oberösterreich)是奥地利面积第四大的州(11,980平方公里)和人口第三多的州(1,376,797)。首府林茨。和德国与捷克共和国相连。上奥地利州分为15县3市。分别为:B 布
  • GAD67谷氨酸脱羧酶(英语:Glutamate decarboxylase;GAD)是一个催化谷氨酸脱羧为γ-氨基丁酸并释放CO2的酶。此酶使用磷酸吡哆醛作为一个辅因子。此反应以如下方式进行:此酶在哺乳动物中
  • 普罗卡因普鲁卡因(英文:Procaine),它的商品名为奴佛卡因(英文:Novocaine),一种局部麻醉药。最初用于缓解肌肉注射青霉素引起的疼痛,也用于牙科手术。作用主要是钠离子通道阻滞剂。普鲁卡因是
  • 偶极在电磁学里,有两种偶极子(dipole):偶极子的性质可以用它的偶极矩描述。电偶极矩( p {\displaystyle \mathbf {p} }
  • ic! berlinic! berlin(德语:ic! berlin brillen GmbH)为德国一家高端手工眼镜品牌,1996年由拉夫·安德尔(Ralph Anderl)创立,总部位于德国柏林。ic! berlin的眼镜主要以厚度0.5mm的薄钢作为镜
  • 逆子《逆子》(英文:)是一部人间渡系列之一描写黄瑞芳的真实人生电视剧,全剧共5集,于2011年5月30日-2011年6月3日在大爱电视《长情剧展》时段(台湾时间周一至周五晚上22:00)播放。
  • 马尔哈姆山坐标:47°02′14″N 12°15′39″E / 47.037299°N 12.260739°E / 47.037299; 12.260739马尔哈姆山(德语:Malhamhorn),是奥地利的山峰,位于该国西部,由蒂罗尔州负责管辖,属于维内迪
  • 希德·黑格雪梨·艾迪·摩西安(英语:Sidney Eddie Mosesian,1939年7月14日-2019年9月21日)或称作席德·黑格(英语:Sid Haig),是一名美国男演员、制片人和音乐家。黑格时常出演恐怖片,以及在1970