表征学习

✍ dations ◷ 2025-11-20 19:47:45 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 阴道痉挛阴道痉挛是一种影响女性性行为能力的病症。可发生于各种形式的阴道插入中,包括性行为、卫生棉检查、妇科检查中的阴道插入。阴道痉挛是一种耻尾肌(英语:Pubococcygeus muscle)(有
  • 冬季冬季是部分地区一年四季中的第四季,由于天气转冷(赤道地区除外),在很多地区都意味着沉寂和冷清。生物在寒冷来袭的时候会减少生命活动,很多植物会落叶,动物会休眠,有的称作冬眠。候
  • 礼品店礼品店是一个售卖纪念品的商店,主要涉及到一个特定的主题。通常出售都不太平凡的东西,往往包括咖啡杯,毛绒动物玩具,T恤,明信片,手工艺品或馆藏和其他纪念品。礼品店所在的地方通
  • 汽车工业汽车产业,或称汽车工业。是生产汽车有关的工业,包括研发、制造同销售等范畴,是世界上一种比较常见的重工业,是目前世界主要经济支柱之一。
  • 下埃及上下埃及乃埃及在前王朝时期,以孟斐斯为界,位处尼罗河上下游的两个各自独立政权。上游南方地区为上埃及(Upper Egypt),下游北方地区为下埃及(Lower Egypt)。埃及的统一及由之而来的
  • 顺世派顺世论(Lokāyatika),亦作顺世派,7世纪后被称为遮卢婆迦(Cārvāka),是六师外道之一。顺世论是一种唯物论思想,是当时的一种享乐主义思想。顺世论是反对婆罗门种姓制思潮中有利的一
  • 医学期刊联谊会医学期刊联谊会(Journal club)为一群医学相关人定期聚会,其主要目的在严苛评论科学文献上有关医学临床应用之近期文章。医学期刊联谊会促进循证医学于医学文献上的应用,正如每位
  • 水类运动水类运动,是各种与水有关的体育运动统称。就这些运动的主要活动空间与水面的关系,大致可以区分为“水面下”、“水面上”,以及混合两种状况的“水中”三大类。其中有一部分运动
  • 遥控器遥控是指一种远程控制技术,用来遥控机械的装置称为遥控器。现代的遥控器,主要是由集成电路电板和用来产生不同讯息的按钮所组成。遥控技术在工业生产、军事以及科研上均有着大
  • 雀斑雀斑(潮州话称之胡蝇屎)是一种浅褐色小斑点,针尖至米粒大小,常出现于前额、鼻梁和脸颊等处,偶尔也会出现于颈部、肩部、手背等处。雀斑白种人中发生率较高,由色素代谢障碍导致,可能