表征学习

✍ dations ◷ 2025-04-26 12:52:40 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 阿维农阿维尼翁(法语:Avignon,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium",
  • 主题分析主题分析(英语:Thematic analysis)是定性研究中最为常见的一种形式。它强调在数据中精确定位、检查和记录主题或模式。主题(英语:themes)是跨数据集的模式(英语:patterns),这些模式对
  • 滤泡刺激素促卵泡激素(英语:follicle-stimulating hormone, FSH,亦称为卵泡刺激素)是一种由脑垂体合成并分泌的激素,属于糖基化蛋白质激素,因最早发现其对女性卵泡成熟的刺激作用而得名。后
  • 航天动力学航天动力学是研究航天器和运载器在飞行中所受的力及其在力作用下的运动的学科,又称星际航行动力学、天文动力学和太空动力学。航天动力学研究的运动包括航天器的质心运动,称轨
  • ds区元素d区元素是元素周期表中的副族元素,即第3至第12族元素。这些元素中具有最高能量的电子是填在d轨域上的。这些元素有时也被称作过渡金属。D区的D来自英语的“diffuse”。​图解
  • 郁金香参见正文郁金香在植物分类学上,是一类属于百合科郁金香属(学名:Tulipa)的具鳞茎草本植物,又称洋荷花、旱荷花、草麝香、郁香(《太平御览》)、红蓝花、紫述香(《本草纲目》),原产地从南
  • 俄罗斯母亲俄罗斯母亲(俄语:Россия-Матушка)是俄罗斯的国家象征,常出现在政治性的宣传品或雕像上。在苏联时代较常使用“祖国母亲”的国家象征来表示由多元民族所构成的苏联
  • 暂停生命暂停生命、生命暂停(英语:Suspended animation),又可称为人工休眠或人工冬眠(英语:Artificial hibernation)是通过外在的方法(如医疗科技)将生命的过程减慢至近乎暂定的迹象,但生命不
  • 奥斯特拉西亚奥斯特拉西亚(拉丁语:Austrasia)由法兰克王国墨洛温王朝东北部分构成,领土包括今天法国东部、德国西部、比利时,卢森堡和荷兰的领土。虽然梅斯作为首都,但有些国王分别统治兰斯,特
  • 亮点《亮点》周刊 (德语:Stern) 是德国目前最大的时事社会生活杂志,创刊于1948年,杂志出版发行由欧洲最大的杂志出版商古纳雅尔(Gruner + Jahr AG & Co. KG)负责,主要面向德国及全欧洲