首页 >
表征学习
✍ dations ◷ 2024-11-05 18:38:18 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 克劳福德·朗克劳福德·威廉森·朗(Crawford Williamson Long, 1815年11月1日-1878年6月16日),美国外科医生和药剂师,一般认为是他首次使用吸入乙醚作为麻醉剂。不过他的工作在好几年中只有同
- 斯坦利·诺曼·科恩斯坦利·诺曼·科恩(英语:Stanley Norman Cohen,1935年2月17日-),美国遗传学家。科恩就读于罗格斯大学,1956年获得学士学位。然后在宾夕法尼亚大学学习医学,1960年获硕士学位。1968
- 黑火药火药,又名黑火药,是一种早期的炸药,直到17世纪中叶都是唯一的化学爆炸物。火药一般由硫磺、木炭和硝石(硝酸钾)混合而成,其木炭是作为燃料,而硫磺和硝石作为氧化剂。由于火药的燃烧
- 阿里乌教派阿利乌教派(英语:Arianism),又译阿利乌派,即阿利乌主义,是4世纪亚历山大港正教会的包加里教区长老阿利乌及其支持者的基督徒派别,故称阿利乌派。认为《圣经》的启示说明耶稣次于天
- 阿瑟·霍里奇阿瑟·L·霍里奇(英语:Arthur L. Horwich,1951年-),美国生物学家,在耶鲁大学医学院工作,并且自1990年至今一直在霍华德·休斯医学研究所做研究工作。研究领域主要是蛋白质折叠和分子
- 参选人参选人,又名候选人或被选举人,是选举中竞逐一种职位的参与人员。候选人在选举投票前,会举办政见发表会,在电子媒体和平面媒体刊登广告,和印制宣传单宣传,达到发表政治见解和政治理
- 约翰·汉考克约翰·汉考克(John Hancock,1737年1月12日-1793年10月8日),美国革命家、政治家,富商出身。他曾于1775年-1777年任大陆会议主席, 是独立宣言的第一个签署人,美国开国元老之一。由于他
- 天蝎座天蝎座(拉丁语:Scorpius,天文符号:♏),是一个位于南天球的黄道带星座之一,面积496.78平方度,占全天面积的1.204%,在全天88个星座中,面积排行第三十三。每年6月3日子夜天蝎座中心经过上
- 新英格兰医学期刊《新英格兰医学杂志》(英语:The New England Journal of Medicine;简称 NEJM)是由美国麻省医学协会(英语:Massachusetts Medical Society)所出版的同行评审性质之医学期刊。它也是
- C++C++是一种被广泛使用的计算机程序设计语言。它是一种通用程序设计语言,支持多重编程模式,例如过程化程序设计、数据抽象、面向对象程序设计、泛型程序设计和设计模式等。比雅