首页 >
表征学习
✍ dations ◷ 2025-12-06 03:30:35 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 弗雷德里克·班廷弗雷德里克·格兰特·班廷爵士,KBE,MC,FRS,FRSC(英语:Sir Frederick Grant Banting,1891年11月14日-1941年2月21日)是加拿大一位杰出的医学家和诺贝尔生理学或医学奖获得者。班廷是在
- 生物防治剂生物防治(Biological control)或生物害虫防治(Biological pest control)是病虫害防治的一种方法,使用生物(英语:bioeffector)缓解昆虫、螨虫、野草和病态植物对人类农作物、环境等造
- 2012年现象2012年预言或2012年现象(英语:2012 phenomenon)是一个关于末世论的预言、信仰或传说、谣言,宣称美洲的玛雅文明中的玛雅历长达5,126年周期的结束,预言了地球、世界和人类社会在公
- 美国科学促进会美国科学促进会(英语:American Association for the Advancement of Science,缩写为AAAS),创建于1848年9月20日,是世界最大的非营利科学组织,下设21个专业分会,所涉包括数学、物理学
- 氯化烯丙基钯二聚物氯化烯丙基钯(II)二聚物是一个化合物,其化学式为(η3-C3H5)2Pd2Cl2。此一黄色且空气稳定的化合物是有机合成中的一个重要的催化剂。此化合物是经由将一氧化碳通入氯化钯、氯
- 罗兰之歌罗兰之歌(法语:La Chanson de Roland)是一首法兰西11世纪的史诗(武功歌),改编自公元778年查理曼统治时期发生的隆塞斯瓦耶斯隘口战役。它是现存最古老的重要法语文学,在各种手稿中
- 国际奥林匹克委员会国际奥林匹克委员会(简称国际奥委会;法语:Comité international olympique,CIO;英语:International Olympic Committee,IOC)是一个非政府、非营利的国际体育组织,总部位于瑞士洛桑。
- 二甲基砜二甲基砜(Methylsulfonylmethane),简称为有机硫 (MSM)其化学式为(CH3)2SO2、甲基硫酰基甲烷的砜类有机化合物。二甲基砜在常温下是无色固体,无化学活性。在一些植物中含有二甲
- 王子皇子或王子是对拥有皇帝、王、国王等头衔君主的儿子的称谓。作为皇族或王室成员,通常会授予他们国内的最高爵位。此外,拥有王爵皇族的儿子亦可称为王子。皇孙、王孙则泛指君主
- 科学普及科学普及,简称科普,又称大众科学、流行科学(英语:popular science)或者普及科学,是指利用各种传媒以浅显的方式向普通大众普及科学技术知识,倡导科学方法、传播科学思想、弘扬科学
