首页 >
表征学习
✍ dations ◷ 2025-12-11 16:58:30 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 冻土冻土是指土壤温度保持0℃以下并出现冻结现象、具有表土呈现多边形土或石环等冻融蠕动等形态特征的土壤或岩层。全球冻土面积约590万平方公里,占陆地总面积的5.5%。冻土形成过
- 派克县派克县(Pike County, Georgia)是美国乔治亚州西部的一个县。面积568平方公里。根据美国2000年人口普查,共有人口13,688人。县治纪伯伦(Zebulon)。成立于1822年12月9日。县名纪念
- 棉纸棉纸,一种传统的手工纸,常用于撕画、水墨画及书法等,也可用于包装。最早起源于中国,后流传到台湾、日本、韩国等周边国家。因为其质地洁白,如同棉花,撕开后纤维如同棉丝,因此得名。
- 油泼辣子油泼辣子是陕西方言,云南方言则称其为油辣子,是辣油的一种,其具有辣、香味醇厚的特点,颜色棕褐色、深棕色或橘红色。油泼辣子最常见的用约八成热的食用油倒入干辣椒粉充分搅拌即
- 李邦河李邦河(1942年-),浙江温州乐清市人,知名数学家。主要从事微分拓扑、低维拓扑的量子不变量、非标准分析和广义函数等领域的研究。1965年毕业于中国科学技术大学数学系,现为中科院数
- 孤儿受体孤儿受体 (英语:orphan receptor)是指一些与其它已确认的受体结构上明显相似,但其内源配体还未发现的受体。一旦对应的配体被找到,该受体就被称为“领养孤儿”("adopted orphan")。
- 女仆装女仆装(又称女仆服)是指女仆的工作装,通常也指仿照这种工作装而制作的女性服装,通常带有围裙。在19世纪末的法国,佣人与女管家大多穿着这种服装工作。其在日系动漫及Cosplay中十
- 神经病变周边神经病变(英语:Peripheral neuropathy,缩写PN)俗称神经系统疾病,是指神经系统的疾病或异常状态下的神经系统 。虽然在大众文化中神经病常常是一种代替精神病的说法,但神经病实
- 哈萨克斯坦共和国宪法哈萨克斯坦政府与政治 系列条目哈萨克斯坦共和国宪法(哈萨克语:Қазақстан Республикасының Конституциясы,Qazaqstan Respuwblïkasın
- 丁醇燃料丁醇可以被用作内燃机的燃料。因为它较长的烃链,导致其对相当非极性,把丁醇和乙醇相比,丁醇更类似于汽油。丁醇已被证明可用于工作于设计使用汽油的汽车而无需修改汽车。它有一
