首页 >
表征学习
✍ dations ◷ 2025-07-06 07:38:52 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 羊膜羊膜是羊膜动物(包括爬行动物,鸟类 和哺乳动物)的胚胎所具有的一种结构。其本质是一层封闭的生物膜,其内包裹着的空间称为羊膜囊,内含的液体称为羊水。羊膜的主要作用是保护胚胎
- 复合性原理在数学、语义学和语言哲学中,复合性原理是指,一个复杂表达式的意义是由其各组成部分的意义以及用以结合它们的规则来决定的。复合性原理认为,在有意义的句子中,如果实词部分被从
- 赛车赛车(英语:Automobile Racing、Car Racing,motorsport)是一种竞速运动。在1895年,这项运动第一次在法国出现。如今,它已经成为了全世界吸引最多观众观看的体育赛事之一。而现时赛
- 维多里奥·狄西嘉维多里奥·狄西嘉(意大利语:Vittorio De Sica,1901年7月7日-1974年11月13日)是一位意大利导演与演员,也是电影史上一位相当重要的导演,四次奥斯卡最佳外语片获奖导演。
- 大葱葱(学名:Allium fistulosum),别名青葱、大葱、叶葱、胡葱、葱仔、菜伯、水葱和事草,为多年生草本植物,叶子圆筒形,中间空,脆弱易折,呈青色。在东亚国家以及各处亚裔地区中,葱常作为一
- 阿兰查·桑切斯·维卡里奥阿兰扎祖·伊莎贝尔·玛丽亚·桑切斯·维卡里奥(西班牙语:Aránzazu Isabel Maria Sanchez Vicario,1971年12月18日-),西班牙退役女子网球运动员,为第7位登上WTA单打排名第1的选手,4
- 散囊菌目散囊菌目是子囊菌门的一目,部分物种被称之为绿霉或青霉。
- compulsions强迫行为(英语:Compulsive behavior),又称作态行为,是一种重复与持续的行为,当事人无法由这种行为中获得益处或满足感,但难以停止去做这种行为的内在冲动。这类行为在一般人的身上
- 圣地佛教圣地是指佛教的圣地,佛教三大传承都有各自的圣地。佛教起源于印度,遍布东南亚、南亚地区,故这一大片地区的佛教故地很多,部分还是佛陀住世时期,安住、宣法、巡游时的圣地,其中
- NFC近距离无线通信(英语:Near-field communication,NFC),又简称近距离通信或近场通信,是一套通信协议,让两个电子设备(其中一个通常是移动设备,例如智能手机)在相距几厘米之内进行通信。N