监督学习

✍ dations ◷ 2025-10-22 12:25:47 #机器学习

监督学习(英语:Supervised learning),又叫有监督学习,监督式学习,是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。

监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:

另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。

目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。

监督式学习的目标是在给定一个 (, ())的集合下,去找一个函数。

假设符合行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数

其中,是的陪域,且会对应到非负实数(可能有其它限制)。如果预测出来的值是,但实际值是,而(, )这个量是其间的。

某个函数的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:

现在的目标则是在一堆可能的函数中去找函数*,使其风险(*)是最小的。

然而,既然的行为已知适用于此有限集合(11), ..., nn),则我们可以求得出真实风险的近似值,譬如,其为:

选择会最小化经验风险的函数*就是一般所知的原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?

一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。

相关

  • 罗马式建筑罗曼式建筑(英语:Romanesque architecture,又译罗马式建筑、罗马风建筑、似罗马建筑)为欧洲中世纪一种以半圆拱为特征的建筑风格,并从12世纪开始逐渐过渡到以尖拱为特征的哥特式
  • 火浣布火浣布,亦称火烷布,为用石棉纤维纺织而成的布。因具有不燃性,且在火中可去污,而得名。有传说称此为日南郡北景县的一种火鼠(火光兽)毛皮编织而成。其名最早现于《列子》。
  • 布里真德坐标:51°30′26″N 3°34′42″W / 51.5072°N 03.5784°W / 51.5072; -03.5784布里真德(英语:Bridgend),是威尔士的一个郡自治市镇。距离威尔士首府加的夫约22-英里(35-千米),它的
  • 韩国料理汤饭馔韩国料理(韩语:한국 요리),又称韩餐、韩食、韩国菜/朝鲜菜、朝鲜料理(韩语:조선료리)等,泛指朝鲜民族的饮食文化。韩国料理以清淡为主,少油腻,多有辣。韩国料理有着阴阳五行的思
  • 威廉斯敦 (马萨诸塞州)威廉斯敦(Williamstown)是美国马萨诸塞州伯克希尔县的一个镇。
  • 九和路九和路(Jiouhe Rd.)为高雄市大寮区北边的南北向重要干道,地理位置接近高屏溪下游。本道路经义和地区,亦邻近大树九曲堂及九曲堂车站及高屏旧铁桥,全线属台29线。起端于大树、大寮
  • 塔塔加龙胆塔塔加龙胆(学名:)是龙胆科龙胆属的高山植物,为一年生草本植物。原产于台湾海拔约2,500—3,500米山区,分布于玉山及中央山脉南段,尤以塔塔加一带居多,为台湾特有种植物。生长在遮阴
  • 奥马里·艾德列治奥马里·艾德列治,(英语:Omari Aldridge,1984年2月6日-),圣文森特和格林纳丁斯职业足球运动员,现效力卡沙(英语:Khalsa Sporting Club)。出生于加拿大的他,他曾效力圣弗朗西斯大学及鲍林
  • 土耳其裔保加利亚人保加利亚土耳其人(保加利亚语:български турци,土耳其语:Bulgaristan Türkleri) ,是保加利亚最大少数民族,占总人口10%。土耳其人是在14世纪越过达达尼尔海峡入侵到
  • 庙街航空庙街航空(Nikolayevsk-na-Amure Air Enterprise)曾是一家总部设在庙街的航空公司。庙街航空仅经营区域航线,总部设在庙街机场。庙街航空成立于1992年,曾是俄罗斯航空庙街分公司