监督式学习

✍ dations ◷ 2025-04-24 23:18:19 #监督式学习
监督式学习(英语:Supervised learning),是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。监督式学习的目标是在给定一个 (x, g(x))的集合下,去找一个函数g。假设符合g行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布p,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数 L其中,Y是g的陪域,且L会对应到非负实数(L可能有其它限制)。如果预测出来g的值是z,但实际值是y,而L(z, y)这个量是其间的损失。某个函数f的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:现在的目标则是在一堆可能的函数中去找函数f*,使其风险R(f*)是最小的。然而,既然g的行为已知适用于此有限集合(x1, y1), ..., xn, yn),则我们可以求得出真实风险的近似值,譬如,其经验风险为:选择会最小化经验风险的函数f*就是一般所知的经验风险最小化原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。 这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。 以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。

相关

  • 咽后脓肿咽后脓肿(retropharyngeal abscess (RPA))是位于喉咙后部之咽后壁(咽后间隙(英语:Retropharyngeal space))组织中的脓肿。由于咽后脓肿通常发生在深部组织中,因此仅通过身体检查是难
  • 磺胺醋酰磺胺醋酰(Sulfacetamide),是一种磺胺类人工合成抗菌药,主要通过局部用药治疗局部感染,也可以口服用于治疗泌尿道感染。磺胺醋酰室温下呈白色,水溶性强。磺胺醋酰的药物活性在磺胺
  • 感冒的普通感冒(common cold),俗称伤风,医学上还称为急性上呼吸道感染或急性鼻咽炎,是一种上呼吸道的病毒性感染,主要原发于鼻腔,但也可能进犯喉咙以及鼻窦。症状一般于暴露病原后两天内
  • span class=chemf style=white-space:nowrap;Csub10/sub正癸烷是化学式为CH3(CH2)8CH3的烷烃,总共有136种异构体,若不计立体异构则为75个,全都是可燃液体。癸烷是汽油的组分之一。与其他烷烃类似,癸烷是非极性分子,不易溶于水之类的极
  • 奥尔良奥尔良(法语:Orléans)是位于法国中部的城市,为中央-卢瓦尔山谷大区首府和卢瓦雷省省会。奥尔良地区地势平坦,海拔在90—124米之间,市内绝大多数地方起伏不超过10米。法国第一大河
  • 帕特里克·莫迪亚诺《星形广场》(La Place de l'Étoile)(1968)、 《环城大道》(Les Boulevards de ceinture)(1972)、 《暗店街》(Rue des boutiques obscures)(1978)、 《多拉·布吕德》(Dora
  • 芦沟桥坐标:39°51′01″N 116°13′09″E / 39.8502497°N 116.2190658°E / 39.8502497; 116.2190658卢沟桥,原名广利桥,位于中华人民共和国北京市丰台区的永定河上,东距宛平城170米
  • 起始点识别复合物结构 / ECOD结构 / ECOD结构 / ECOD在分子生物学中,起始点识别复合物(origin recognition complex, ORC)是指一种真核生物体内的含有多个亚基、与DNA结合的复合物。它与DNA通过
  • 切削液切削液,是一种特别为机械加工而设的冷却剂和润滑剂。其中包括油、油水乳化液、膏剂、凝胶、气雾、空气或其他气体。他们可能会从石油馏出物、动物脂肪、植物油、水和空气、或
  • 德国大学卓越计划德国精英大学计划(德语:Exzellenzinitiative)是德国联邦教育及研究部和德国科学基金会发起的,旨在提高促进德国大学科技研究和学术创新的计划。计划包括资助特定的杰出大学,资助