表征学习

✍ dations ◷ 2025-12-04 07:13:14 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 酒精搓手液酒精搓手液,又名搓手液、免冲水洗手液、免洗洗手液等,是一种用作洗手的液体。酒精搓手液的主要成分为酒精,用作杀菌。由于酒精搓手液无需用水冲洗,所以可以用于外出时清洁双手之
  • 褐藻素褐藻素(Fucoxanthin)是分子式为C42H58O6的叶黄素类,是褐藻纲的叶绿体中常见的色素,也存在在及大部分不等鞭毛类生物中,使其有褐色至绿色的色泽。褐藻素会吸收可见光谱中蓝绿色至
  • 跑步的定义是指陆生动物使用足部,移动最快捷的方法。它在运动上的定义是一种步伐,有时双脚不会同一时间碰到地面。它亦是一种有氧的运动或无氧的运动。跑步是整个身体协调的过
  • 国际护士节国际护士节(英文:International Nurses Day,缩写:IND)是为纪念近代护理学和护理教育的创始人南丁格尔而订定的。弗罗伦斯·南丁格尔(Florence Nightingale,1820年5月12日至1910年8
  • 会合-舒梅克号会合-舒梅克号(Near Earth Asteroid Rendezvous - Shoemaker)是美国国家航空航天局的太空探测卫星,会合-舒梅克号这个名称则是为了纪念天文学家尤金·舒梅克(Eugene M. Shoemake
  • gDNA基因组脱氧核糖核酸是染色体DNA,这一概念与染色体外DNA(如质粒)相对,常简写为gDNA。生物的基因组(由gDNA编码)是遗传的生物学信息,从生物的一代传到下一代。基因组被转录产生RNA,这
  • 葡萄牙人葡萄牙人(葡萄牙语:os portugueses)是欧洲的一个民族。主要居住在欧洲西南部伊比利亚半岛西端的葡萄牙和拉丁美洲的巴西。葡萄牙人以葡萄牙语为母语。多信奉天主教,天主教仍是葡
  • 加勒白眼蝶加勒白眼蝶(又译作大理石条纹粉蝶,学名:Melanargia galathea)是眼蝶亚科白眼蝶属的一种,分布在大部分的欧洲、北非及远东至伊朗,于20世纪末更扩展至英国。其的毛虫主要吃多种的草,
  • 约翰约翰(英文:John,1166年12月24日-1216年10月19日),英格兰国王,由1199年到1216年在位。亨利二世第五子,母亲为阿基坦的埃莉诺,而幼王亨利、狮心王理查、布列塔尼公爵若弗鲁瓦二世则是约
  • 单链构象多态性单链构象多态性(英语:single-strand conformation polymorphism,简称为SSCP)是一种分离核酸的技术,可以分离相同长度但序列不同的核酸(性质类似于DGGE和TGGE,但方法不同)。在非变性