监督式学习

✍ dations ◷ 2025-01-23 04:49:00 #监督式学习
监督式学习(英语:Supervised learning),是机器学习的一种方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。一个监督式学习者的任务在观察完一些事先标记过的训练范例(输入和预期输出)后,去预测这个函数对任何可能出现的输入的输出。要达到此目的,学习者必须以"合理"(见归纳偏向)的方式从现有的资料中一般化到非观察到的情况。在人类和动物感知中,则通常被称为概念学习(concept learning)。监督式学习有两种形态的模型。最一般的,监督式学习产生一个全域模型,会将输入物件对应到预期输出。而另一种,则是将这种对应实作在一个区域模型。(如案例推论及最近邻居法)。为了解决一个给定的监督式学习的问题(手写辨识),必须考虑以下步骤:另外对于监督式学习所使用的辞汇则是分类。现著有著各式的分类器,各自都有强项或弱项。分类器的表现很大程度上地跟要被分类的资料特性有关。并没有某一单一分类器可以在所有给定的问题上都表现最好,这被称为‘天下没有白吃的午餐理论’。各式的经验法则被用来比较分类器的表现及寻找会决定分类器表现的资料特性。决定适合某一问题的分类器仍旧是一项艺术,而非科学。目前最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类。监督式学习的目标是在给定一个 (x, g(x))的集合下,去找一个函数g。假设符合g行为的样本集合是从某个更大甚至是无限的母体中,根据某种未知的概率分布p,以独立同分布随机变量方式来取样。则可以假设存在某个跟任务相关的损失函数 L其中,Y是g的陪域,且L会对应到非负实数(L可能有其它限制)。如果预测出来g的值是z,但实际值是y,而L(z, y)这个量是其间的损失。某个函数f的风险是定义成损失函数的期望值。如果几率分布p是离散的(如果是连续的,则可采用定积分和几率密度函数),则定义如下:现在的目标则是在一堆可能的函数中去找函数f*,使其风险R(f*)是最小的。然而,既然g的行为已知适用于此有限集合(x1, y1), ..., xn, yn),则我们可以求得出真实风险的近似值,譬如,其经验风险为:选择会最小化经验风险的函数f*就是一般所知的经验风险最小化原则。统计学习理论则是研究在什么条件下经验风险最小化才是可行的,且预斯其近似值将能多好?一个情况是,有大量尚未标示的资料,但去标示资料则是很耗成本的。一种方法则是,学习算法会主动去向使用者或老师去询问标签。 这种形态的监督式学习称为主动式学习。既然学习者可以选择例子,学习中要使用到的例子个数通常会比一般的监督式学习来得少。 以这种策略则有一个风险是,算法可能会专注在于一些不重要或不合法的例子。

相关

  • 过敏青霉素(Penicillin,或音译盘尼西林)是指分子中含有青霉烷、能破坏细菌的细胞壁并在细菌细胞的繁殖期起杀菌作用的一类抗生素,是由青霉菌中提炼出的抗生素。青霉素属于β-内酰胺
  • 麻醉科医师人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学麻醉科医师(英语:Anesthesiologist)是指
  • 极光极光,是一种等离子体现象,主要发生在具有磁场的行星上的高纬度区域,而在地球上的极光带即是经度上距离地磁极10°至20°,纬度宽约3°至6°的区域。当磁暴发生时,在较低的纬度也会
  • 玻璃玻璃是一种呈玻璃态的无定形体,熔解的玻璃经过迅速冷却(过冷)而成形,虽为固态,但各分子因没有足够时间形成晶体,仍冻结在液态的分子排布状态。玻璃一般而言是透明、脆性、不透气、
  • 糖精糖精(Saccharin),学名邻苯甲酰磺酰亚胺,是一种不含有热量的甜味剂。1879年由美国约翰霍普金斯大学化学家Constantin Fahlberg发现。为白色结晶性粉末,难溶于水,对热安定与否仍存在
  • 泽西岛泽西(Jersey),英国王冠属地,位于诺曼地半岛外海20公里处的海面上,是英吉利海峡靠近法国海岸线的海峡群岛里,面积与人口数都最大的一座。泽西岛与周边两座无人岛群——曼逵尔(Minqui
  • 不一致的比较不一致的比较(inconsistent comparison)是一种非形式谬误,指将对不同对象采用不同基准作出的比较,并列作为理据证成某主张。这种谬误有时是出于对运用比较数据的概念模糊,是无意
  • 冯士筰冯士筰(1937年3月8日-),天津人,中国海洋学家,中国海洋大学教授,中国科学院院士。主要从事物理海洋学研究。1962年毕业于清华大学工程力学数学系,后分配至山东海洋学院任教。1997年当
  • 童谣儿歌,又称童谣,是一种以儿童为主要对象的歌曲,曲色旋律多半较为简单,歌词亦简单琅琅上口,使儿童容易记忆(但未必各年龄层都能充分理解)。这类的歌曲可能是民谣(如丢丢铜仔)、模拟儿童
  • 中信房屋中信房屋中介股份有限公司(英语:CTBC Real Estate Co., Ltd.,简称:中信房屋),是台湾的加盟体系房屋中介公司,也是台湾第一家获准以“房屋中介”行业登记成立的公司,1997年5月时转型