表征学习

✍ dations ◷ 2025-12-02 17:43:35 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 美服培酮美服培酮 (Mifepristone,又称RU-486),中国大陆译米非司酮,是口服堕胎药,常与米索前列醇并用以终止妊娠。这种配方在妊娠前50天有95%的成功率,在怀孕中期也相当有效 。在施药后两周
  • 电子邮箱电子邮件(英语:electronic mail),简称电邮(email、e-mail),是指一种由一寄件人将数字信息发送给一个人或多个人的信息交换方式,一般会通过互联网或其他电脑网络进行书写、发送和接收
  • 黏合剂黏着剂也称胶黏剂、黏合剂、胶水,在1942年被哈利·库弗博士(英语:Harry Coover)发明。指将两个物体黏附在一起的材料,根据所要黏合材料的特性(主要是表面特性,如粗糙度),使用不同的黏
  • 嗜热嗜热生物,或者多数可被称作嗜热菌,是在相对高的温度下中生存的生物,温度范围在45和122 °C(113和252 °F),是嗜极生物的一类。很多嗜热生物是古细菌。在地球上,嗜热生物可以在很多
  • Gsub1/sub期G1期是细胞周期中间期的一个阶段,位于S期之前。对于大多数细胞,G1期占据了其寿命的大多数时间。细胞在此期间复制细胞器并合成生长所需的糖、蛋白质和脂质,因此需要大量结构蛋
  • 克洛维一世克洛维一世(法语:Clovis Ier,466年-511年11月27日),法兰克王国奠基人、国王。481年6月26日,法兰克人部落萨利昂法兰克人(英语:Salian Franks)的首领希尔德里克一世逝世,其子克洛维一世
  • 圣瓦西里主教座堂圣瓦西里主教座堂(俄语:Собор Василия Блаженного,全称 Собор Покрова пресвятой Богородицы, что на Рву,意指
  • 诺贝尔奖争议诺贝尔奖争议是一些关于历史上诺贝尔奖获奖者所产生的争议,而历年来文学奖与和平奖所招致的争议最多。诺贝尔奖是根据瑞典化学家阿尔弗雷德·诺贝尔的遗嘱所设立的奖项。他在
  • 瓦连京·亚宁瓦连京·拉夫连季耶维奇·亚宁(俄语:Валентин Лаврентьевич Янин,1929年2月6日-2020年2月2日),俄罗斯历史学家,考古学家。1929年生于维亚特卡,在家族悲剧的
  • Nasub2/subSiOsub3/sub硅酸钠(化学式:Na2SiO3),俗称泡花碱、玻璃胶,是无色、透明的粘稠状固体。硅酸钠由石英砂与碳酸钠熔合而成;溶于水呈碱性,其透明的浆状溶液称为水玻璃。硅酸钠遇酸分解,析出硅酸的胶