表征学习

✍ dations ◷ 2025-04-02 09:52:43 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 统计学统计学是在数据分析的基础上,研究测定、收集、整理、归纳和分析反映数据数据,以便给出正确消息的科学。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用在各门学科,从自
  • 德国痳疹风疹(英语:rubella, German measles, three-day measles),又称德国麻疹或三日麻疹,是一种由风疹病毒(英语:Rubella virus)感染所造成的疾病。本病的症状轻微,半数患病者通常不会有自
  • 数学家数学家是指一群对数学有深入了解的的人士,将其知识运用于其工作上(特别是解决数学问题)。数学家专注于数、数据、逻辑、集合、结构 (数学)、空间、变化。专注于解决纯数学(基础
  • 美国食品药品监督管理局美国食品药品监督管理局(英语:U.S. Food and Drug Administration,缩写为FDA)为美国卫生与公众服务部直辖的联邦政府机构,其主要职能为负责对美国国内生产及进口的食品、膳食补充
  • 西门子西门子 (英语:Siemens),又称为西门,符号为S,是物理电路学及国际单位制中,电阻、电纳和导纳,三种导抗的单位。由于西门为欧姆(英语:ohm)的倒数,因此在英语中又被称为mho。西门子在第1
  • 法雷部落法雷人(英语:Fore),是生活在巴布亚新几内亚东高地省奥卡普区的巴布亚人,人口约20000人。1950年代的神经系统疾病库鲁病(哈哈病)在南方法雷人之中发现,在1957年至1960年,约1000人因此
  • 日晷日.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-setting
  • 丕平王朝加洛林王朝(法语:les Carolingiens,旧称Carlovingiens,中世纪拉丁语:Karolingi,又译卡洛林王朝)是自公元751年后统治法兰克王国的王朝。在此之前,其王朝成员以“宫相”的身份涉理王
  • 蟾蜍二烯羟酸内酯蟾蜍二烯羟酸内酯(英语:Bufadienolide,或称为蟾二烯羟酸内酯)是一种带有腺甾烷结构的化合物,其甾环17号位上的侧链带有2-吡喃酮基团,其衍生物包括有许多蟾蜍甾型的糖苷配基,是强心
  • 初等代数初等代数是一个初等且相对简单形式的代数,教导对象为还没有数学算术方面正规知识的学生们。当在算术中只有数字和其运算(如:加、减、乘、除)出现时,在代数中也会使用符号(如: