表征学习

✍ dations ◷ 2025-12-06 22:19:57 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • X光片X射线(英语:X-ray),又被称为爱克斯射线、艾克斯射线、伦琴射线或X光,是一种波长范围在0.01纳米到10纳米之间(对应频率范围30 PHz到30EHz)的电磁辐射形式。X射线最初用于医学成像诊
  • 凝乳凝乳(curd)是指一种将牛乳和羊乳等乳类发酵之后制作和乳制品,也是起司的一种,是茅屋起司的原料之一,可直接生食。凝乳经常在中欧和东欧食用。凝乳含有较多的脂肪。凝乳的制作方法
  • 全球黯化全球变暗是指自20世纪50年代以来开展全球系统观测后发现的地球表面接受的直接太阳辐射逐年减少的现象。这个现象虽然会因地点而异,但就全球平均而言,自1960年到1990年的30年间
  • 述宾短语述宾短语,或称述宾词组,是短语的结构分类之一,它是由两个成分以“支配、关涉”的关系组成的一类结构:前面是述语,后面是宾语。宾语是述语所表示的动作或现象所支配或关涉到的对象
  • 内隐记忆内隐记忆(implicit memory),又称为程序记忆(procedural memory),一种长期记忆的形式,指关于技术、过程、或“如何做”的记忆。记忆有时候会被贮存在程序记忆(procedural memory)中,当
  • 亚洲大学亚洲大学,简称亚大,是一所位于台湾台中市雾峰区的私立大学,前身为台中健康暨管理学院。学术单位包括医学暨健康学院、护理学院、资讯电机学院、管理学院、人文社会学院、创意设
  • 黾部,为汉字索引中的部首之一,康熙字典214个部首中的第二百〇五个(十三划的则为第一个)。就正体中文中,黾部归于十三划部首,而简体中文则归在八划。黾部只以下方为部字。且无其他
  • 反密码子转运核糖核酸(Transfer RNA),又称传送核糖核酸、转移核糖核酸,通常简称为tRNA,是一种由76-90个核苷酸所组成的RNA,其3'端可以在氨酰-tRNA合成酶催化之下,接附特定种类的氨基酸。转
  • 迈克尔·格伦斯坦迈克尔·格伦斯坦(英语:Michael Grunstein,1946年-),美国生物化学家, 加利福尼亚大学洛杉矶分校医学院教授。格伦斯坦在麦吉尔大学获得学士学位,在英国爱丁堡大学获博士学位。他在
  • 自然村落自然村落(自然村),指的是自然形成的聚落,而不是国家以政治力量划分的区划(此种被称为行政村)。中国南方的湖南小的地名常冠以“冲”如“韶山冲”即指“自然村落”,这与南方地区多丘