首页 >
表征学习
✍ dations ◷ 2025-08-22 02:08:07 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 结核结核病(Tuberculosis,又称TB)为结核杆菌感染引起的疾病。结核通常造成肺部感染,也会感染身体的其他部分。大多数感染者没有症状,此型态感染称为潜伏结核感染(英语:Latent tuberculo
- 芜菁发黄镶嵌病毒科芜菁变(发)黄镶嵌病毒属 玉蜀黍雷亚多精致病毒属 小黑点斑(纹)病毒属芜菁发黄镶嵌病毒科,又称芜菁变黄镶嵌病毒科(Tymoviridae),是病毒的一科,包括以下属:
- 灰质灰质(英语:Gray matter),又称为皮质(英语:Cortex),是一种神经组织,是中枢神经系统的重要组成部分。灰质由神经元,神经胶质细胞,微血管组成。灰质的灰色源于神经元的细胞体和微血管。中
- 线性回归在统计学中,线性回归(英语:linear regression)是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回
- 索尔维会议索尔维国际物理学化学研究会(法语:Institut International de Physique Solvay)是由比利时企业家欧内斯特·索尔维于1912年在布鲁塞尔创办的一个学会。此前一年他通过邀请举办
- 法国电影法国电影(法语:Cinéma français)是指在法国制作或由法国人制作的电影。法国是电影的发源地,卢米埃兄弟被认为对于电影的发展有巨大的贡献 。而法国电影的发展对于其他国家的电
- 780110 数学 120 信息科学与系统科学 130 力学 140 物理学 150 化学 160 天文学 170 地球科学 180 生物学210 农学 220 林学 230 畜牧、兽医科学 240 水产学310
- Mg[SiFsub6/sub]氟硅酸镁(Magnesium fluorosilicate),别名硅氟化镁,化学式MgSiF6。一般为六水合物(MgSiF6·6H2O)形式,相对分子质量274.48。六水合物为无色或白色无气味针状或菱形结晶。该结晶难潮
- 钙调蛋白钙调蛋白(英语:Calmodulin,简称CaM),是一种能与钙离子结合的蛋白质,普遍存在真核生物细胞中。钙调蛋白是一种多功能中介钙结合蛋白。它是第二信使
- 硬木硬木(hardwood),或称硬植木,即为阔叶树材,指由被子植物门的树所生成的木材。硬木与又称做软木的针叶树材刚好成一对比。硬木一般密度较高及较硬实,但硬木及软木的真正硬度差异很大