首页 >
监督式学习
✍ dations ◷ 2025-10-30 01:43:16 #监督式学习
监督式学习(英语:Supervised learning),是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。监督式学习的目标是在给定一个 (x, g(x))的集合下,去找一个函数g。假设符合g行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布p,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数 L其中,Y是g的陪域,且L会对应到非负实数(L可能有其它限制)。如果预测出来g的值是z,但实际值是y,而L(z, y)这个量是其间的损失。某个函数f的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:现在的目标则是在一堆可能的函数中去找函数f*,使其风险R(f*)是最小的。然而,既然g的行为已知适用于此有限集合(x1, y1), ..., xn, yn),则我们可以求得出真实风险的近似值,譬如,其经验风险为:选择会最小化经验风险的函数f*就是一般所知的经验风险最小化原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。
这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。
以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。
相关
- 罗他霉素罗他霉素(英语:Rokitamycin)又称为“罗吉他霉素”“丙酰吉他霉素”或“丙酰白霉素”,是一种大环内酯类抗生素。 是由北里链霉菌(Streptomyces kitasatoensis)的菌株中发现的。罗他
- 乱世佳人《乱世佳人》(英语:Gone with the Wind),是一部根据小说家玛格丽特·米切尔的英文同名小说《飘》(Gone with the Wind)改编的美国电影。男女主角分别由克拉克·盖博(Clark Gable)和
- 壳聚糖壳聚糖(英语:Chitosan),是一种线性多糖,当中由氨基葡萄糖(脱乙酰单位)和N-乙酰葡糖胺(乙酰单位)随机分布,并透过β-(1-4)糖苷键组合而成。由于甲壳素(Chitin)也有多个译名,如几丁质或壳多糖
- 苯甲醇苯甲醇(分子式:C6H5CH2OH)也称苄醇,是最简单的含有苯基的脂肪醇,可以看作是羟甲基取代的苯,或苯基取代的甲醇。它是有微弱芳香气味的无色透明黏稠液体,有极性,低毒,蒸汽压低,因此用作
- abbr class=abbr title=S36: 穿戴适合的防护服S36/abbr安全建议标准词(英语:Safety phrases,简写:S-phrases)是于《欧盟指导标准67/548/EEC 附录Ⅳ: 有关危险物品与其储备的安全建议》里定义。该列表被集中并再出版于指导标准2001/59/
- 诸子百家诸子百家是后世对华夏先秦学术思想人物和派别之总称。诸子是指中国先秦时期老子、庄子、孔子、孟子、荀子、墨子、列子、申子、韩非子等学术思想代表人物。春秋后期已出现颇
- TSPAN30n/an/an/an/an/an/an/an/an/an/aCD63是一种蛋白质抗原,在人体中由CD63基因编码。CD63主要出现在细胞外囊泡的表面,也会出现在普通的细胞膜表面。透膜四超家族(transmembrane 4
- 弯曲键弯曲键,也称香蕉键,是有机化学中的一类共价键,其3D模拟形状就像一个香蕉。这个概念描述的是一个小环分子内“弯曲的”电子密度或电子排布,例如环丙烷,白磷中的共价键和乙硼烷中的
- Vitamin D维他命D也称抗佝偻病维他命,是一类脂溶性维他命,属类固醇化合物。在人类所需的维他命中,维他命D非常特殊,是一种激素的前体,而且人一天只要暴露在阳光下10分钟,人体自身即可合成足
- 叔丁醇叔丁醇(tert-Butanol;IUPAC名:2-甲基-2-丙醇),又称第三丁醇或新丁醇,是最简单的叔醇,为丁醇四种异构体之一。叔丁醇是具有樟脑香味的液体,易溶于水、乙醇和乙醚。叔丁醇熔点仅仅超过
