首页 >
表征学习
✍ dations ◷ 2025-11-29 23:07:26 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 枪支政策枪支管制的相关政策一直是美国政治中的争议议题。持枪权的支持者和枪支管制的支持者(不等同反对持枪权)在该问题上分歧很大,经常在枪支管制、枪支造成和预防犯罪、公共安全等问
- 临床流行病学临床流行病学是将流行病学知识应用于临床实践。从70年代以来开始盛行,循证医学是临床流行病学应用的表现。与一般的流行病学一样,临床流行病学也分为描述型和分析型两类。
- 生物素生物素(Biotin)为维生素B群之一,又称维生素H、维生素B7、辅酶R(Coenzyme R)等。 生物素在肝、肾、酵母、牛乳中含量较多,是生物体固定二氧化碳的重要因素。容易同鸡蛋白中的一种蛋
- 暴力团暴力团,指以暴力或暴力胁迫方式进行犯罪的反社会团体,是日本警察称呼日本黑道组织的词汇,这些组织一般自称任侠团体或仁侠团体。按照《暴力团对策法》被都道府县公安委员会指定
- 西班牙交响曲《D小调西班牙交响曲》,作品21,是爱德华·拉罗一首为小提琴与乐队而作的协奏曲。作于1874年,虽名为交响曲,但不具交响曲的形式。一开始简短的管弦乐导奏带出整曲的气氛,继之以小
- 刨花板胶合板也叫夹板、多层材(英语:Laminated Veneer Lumber,缩写LVL,更通用的英文用语是Plywood)是第一种发明的科技木材。由比较薄的木单板制作。由相邻两层木纹相互垂直的木片(单板)
- 天祖祖先,又称祖亲、祖宗,是指辈分比自己高的直系血亲,与后代相反。然而,很多时候所指的祖先,通常都是最少隔几代,年代久远的则称为远祖。在很多父系社会,狭义的祖先一词只代指父亲那边
- 科拉伦斯·佩里科拉伦斯·阿瑟·佩里(英语:Clarence Arthur Perry,1872年-1944年9月6日)是美国城市规划师、社会学家、作家和教育家。他出生在纽约州特拉克斯顿。后来,他在纽约市规划部门工作,成
- 巴巴角坐标:39°28′47″N 26°03′50″E / 39.4796904°N 26.0639691°E / 39.4796904; 26.0639691 巴巴角(英语:Cape Baba)位于安那托利亚的最西端,同是也是全亚洲大陆的最西端,是欧、
- 薯蓣属薯蓣属(学名:Dioscorea)是薯蓣目薯蓣科下的一个属,为攀援植物。该属共有600种以上,分布于热带和亚热带地区。本属拥有超过600个物种,部分物种如下:
