首页 >
表征学习
✍ dations ◷ 2025-07-30 00:11:34 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 死后抽搐死后抽搐(cadaveric spasm)亦称尸体痉挛,是指人或动物于死亡后,肌肉未经过松弛阶段就立即发生僵硬,其肢体仍然有的小许动作或者抽搐。这种现象可由肉眼观察到,一般死亡前有剧烈运
- 变应原过敏原(英语:allergen,又称为变应原、过敏物、致敏原、致敏物)是指能引起过敏的物质。严格地说,过敏原是一种能促进在特应性个体发生I型超敏反应的非寄生抗原。尘螨的排泄物、花
- 肠胃道消化系统(英语:digestive system)是多细胞生物用以进食、消化食物、获取能量和营养、排遗剩余废物的一组器官,其主要功能为摄食、消化、吸收、同化和排遗。其中有关排遗的部分,也
- 氯丙嗪氯丙嗪(Chlorpromazine,简称CPZ),常见商标名 Thorazine 或 Largactil ,为一种精神科药物。本品一般用于治疗精神分裂症等思觉失调。其他用途还可用做治疗躁郁症、过动症、恶心、
- 电子邮箱电子邮件(英语:electronic mail),简称电邮(email、e-mail),是指一种由一寄件人将数字信息发送给一个人或多个人的信息交换方式,一般会通过互联网或其他电脑网络进行书写、发送和接收
- 回归年回归年(tropical year),也称为太阳年(solar year),是由地球上观察,太阳平黄经变化360°,即太阳再回到黄道(在天球上太阳行进的轨道)上相同的点所经历的时间。相对于分点和至点,精确的时
- 德拜模型在热力学和固体物理学中,德拜模型(英语:Debye model)是由彼得·德拜在1912年提出的方法,用于估算声子对固体的比热(热容)的贡献。德拜模型把原子晶格的振动(热)当作盒中的声子处理,而
- 波士顿红袜波士顿红袜(Boston Red Sox),是一支位于波士顿的职业棒球队,隶属于美国职棒大联盟的美国联盟东区。球队主场为拥有悠久历史的芬威球场。红袜队是全联盟客场平均观众人数最多的球
- 李吉均李吉均(1933年10月9日-),中国自然地理与地貌学家。出生于四川彭县。1956年毕业于南京大学地理系。1991年当选为中国科学院学部委员(院士)。兰州大学地理系教授。曾任兰州大学地
- 指甲刀指甲剪,又称“指甲钳”,是一种能将包括人类在内的动物的指甲及脚甲进行修剪或美容的刀具。指甲剪是由美国人沃斯·福克世基尔于20世纪30年代发明的。指甲剪通常是以金属制成,同