监督式学习

✍ dations ◷ 2025-06-28 04:40:18 #监督式学习
监督式学习(英语:Supervised learning),是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。监督式学习的目标是在给定一个 (x, g(x))的集合下,去找一个函数g。假设符合g行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布p,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数 L其中,Y是g的陪域,且L会对应到非负实数(L可能有其它限制)。如果预测出来g的值是z,但实际值是y,而L(z, y)这个量是其间的损失。某个函数f的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:现在的目标则是在一堆可能的函数中去找函数f*,使其风险R(f*)是最小的。然而,既然g的行为已知适用于此有限集合(x1, y1), ..., xn, yn),则我们可以求得出真实风险的近似值,譬如,其经验风险为:选择会最小化经验风险的函数f*就是一般所知的经验风险最小化原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。 这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。 以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。

相关

  • 牛乳牛乳,俗称牛奶,是最古老的天然饮料之一。顾名思义,牛乳是牛的乳汁。在不同国家,牛乳也分有不同的等级,目前最普遍的是全脂、高钙低脂及脱脂牛乳。美国将牛乳按照脂肪含量分为五类
  • Bi4f14 5d10 6s2 6p32, 8, 18, 32, 18, 5蒸气压第一:703 kJ·mol−1 第二:1610 kJ·mol−1 第三:2466 kJ·mol−1 (主条目:铋的同位素铋(Bismuth)是一种元素,化学符号是Bi,原子序是83
  • 变形虫门变形虫门是一类似变形虫的(amoeboid)原生生物。变形虫门的多数物种靠细胞内原生质的流动而移动。伪足类似于手指形状、边缘是钝的,所以称作lobopodia,直译为钝的伪足. 大多数是
  • 肽链肽(英语:peptide,来自希腊文的“消化”),旧称胜,即胜肽,又称缩氨酸,是天然存在的小生物分子,介于氨基酸和蛋白质之间的物质。由于氨基酸的分子最小,蛋白质最大,而它们则是氨基酸单体组
  • 光线光通常指的是人类眼睛可以见的电磁波(可见光),视知觉就是对于可见光的知觉。可见光只是电磁波谱上的某一段频谱,一般是定义为波长介于400至700奈(纳)米(nm)之间的电磁波,也就是波长比
  • 端粒端粒(英语:Telomere)是真核生物染色体末端的DNA重复序列,作用是保持染色体的完整性和控制细胞分裂周期。 由于DNA复制的机制,每次染色体复制后,延迟股上的染色体末端必无法被复制
  • 土力学土壤力学是应用土壤物理学(英语:Soil physics)和工程力学方法来研究土的力学性质的一门学科。土壤力学的研究对象是与人类活动密切相关的土和土体,包括人工土体和自然土体,以及与
  • 威廉·杰森·摩根威廉·杰森·摩根(英语:William Jason Morgan,1935年10月10日-),出生在乔治亚州萨凡纳,美国地球物理学家,对板块构造与地球动力学理论方面作出了开创性的贡献。他为哈佛大学地球与行
  • 安妮·麦克拉伦安妮·麦克拉伦(英语:Dame Anne Laura Dorinthea McLaren,1927年4月26日-2007年7月7日),英国生物学家,是发育生物学研究的领军人物。
  • 换气次数换气次数(air exchange per hour)又称换气率(air exchange rate),指单位时间内空气更换的次数,通过单位时间进入房间的风量(m3/h)除以房间体积(m3)计算而得。如果房间通风方式为