首页 >
监督式学习
✍ dations ◷ 2025-06-07 20:38:46 #监督式学习
监督式学习(英语:Supervised learning),是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。监督式学习的目标是在给定一个 (x, g(x))的集合下,去找一个函数g。假设符合g行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布p,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数 L其中,Y是g的陪域,且L会对应到非负实数(L可能有其它限制)。如果预测出来g的值是z,但实际值是y,而L(z, y)这个量是其间的损失。某个函数f的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:现在的目标则是在一堆可能的函数中去找函数f*,使其风险R(f*)是最小的。然而,既然g的行为已知适用于此有限集合(x1, y1), ..., xn, yn),则我们可以求得出真实风险的近似值,譬如,其经验风险为:选择会最小化经验风险的函数f*就是一般所知的经验风险最小化原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。
这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。
以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。
相关
- 显生宙显生宙(Phanerozoic),或称显生元、显生代,是5.41亿年前大量生物出现的时期。显生宙即意为这个时期地球上有显著的生物出现。而那些看不到或者很难见到生物的时代统称为隐生元或
- 镍镉电池镍镉电池(Nickel-cadmium battery,通常简称NiCd,读作“nye-cad”)是一种流行的蓄电池。这种电池以氢氧化镍(NiOH)及金属镉(Cd)作为产生电能的化学品。对比其他种类的蓄电池,镍镉电池
- 雄激素雄激素(英语:androgen、英语:androgenic hormones或英语:testoids),也译为雄性激素、男性激素、男性荷尔蒙,是一种化学成合物的泛称。在于脊椎动物中,凡是能够与雄激素受体(androgen
- 意大利力量党意大利力量党(意大利语:Forza Italia,简称FI)是意大利的一个已不存在的右翼自由保守主义政党。2009年,并入自由人民党。党魁是西尔维奥·贝卢斯科尼。于1993年12月成立,1994年1月1
- 巴西航天局巴西航天局(葡萄牙语:a Agência Espacial Brasileira (AEB))是巴西联邦共和国的公共航天机构。1994年2月10日正式组建,隶属巴西政府下的科学技术与创新部(o Ministério da Ciê
- 特有种特有种(英语:endemic species,指特有性之现象或性质,英文为endemism)是指“因历史、生态或生理因素等原因,造成其分布仅局限于某一特定的地理区域或大陆,而未在其他地方中出现”的
- 望闻问切中医诊断学是根据中医学理论,研究诊查病情、判断病种、辨别证候的基础理论、基本知识和基本技能的一门学科。中医诊断学主要包括诊法学和辨证学两部,两者相互渗透,相互联系。中
- 何尊何尊,西周早期的一件青铜酒器,是一位名叫“何”的贵族用于祭祀的尊,作于周成王五年,是西周最早的有明确纪年的青铜器。1963年,出土于陕西省宝鸡市贾村。何尊是中华人民共和国国家
- 大鹏金翅鸟迦楼罗(梵语:गरुड,转写:Garuḍa;巴利语:Garuḷa),又音译作揭路荼、迦娄罗、蘗噜拏、羯路荼、迦留罗、迦喽荼,伽楼罗、誐噜拏,汉译大鹏金翅鸟、金翅鸟、妙翅鸟、大鹏仙,原是印度神话
- 远传电信股份有限公司坐标:25°01′33.6″N 121°32′57.5″E / 25.026000°N 121.549306°E / 25.026000; 121.549306远传电信(简称远传,英语:Far Eas Tone,缩写:FET)是台湾第三大电信运营商,由远东集团