表征学习

✍ dations ◷ 2025-12-08 11:46:49 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 单纯疱疹病毒Herpes simplex virus 1 (HSV-1) Herpes simplex virus 2 (HSV-2)单纯疱疹病毒(英语:herpes simplex virus; HSV) 1 和 2 (HSV-1 和 HSV-2),也叫人类单纯疱疹病毒 1 和 2 (HHV
  • 真菌病毒真菌病毒(Mycovirus, Mycophage)泛指可以感染真菌的病毒。多数真菌病毒都属于双股RNA病毒(英语:Double-stranded RNA viruses),但也有约三成属于正义单链RNA病毒。真菌病毒必须具
  • ACEI血管紧张肽I转化酶抑制剂(英语:ACE inhibitor,简称为ACEI)是一类抗高血压药。血管紧张素转化酶(ACE)是肾素-血管紧张素-醛固酮(RAA)系统中的一个重要环节,该系统对血压的调节有着及其
  • 猫流感是一种在猫科动物发生的上呼吸道感染病。不过,现时普遍认为这个名称是错误命名,原因是猫流感一般并不是由流感病毒的感染而引起。相反的,它是一种综合征:一个用来泛指所有
  • 铁镁质铁镁质用来形容富含镁元素与铁元素的硅酸盐矿物或岩石,又称基性岩。大多数铁镁质矿物颜色暗并且相对密度大于3。常见的造岩铁镁质矿物包括橄榄石、辉石、闪石和黑云母。常见
  • 天堂的孩子们《天堂的孩子们》(法语:Les Enfants du Paradis)是一部1945年出品的法国黑白电影,片长183分钟,导演马赛尔·卡尔内,编剧雅克·普莱卫,由阿尔莱蒂,让-路易·巴罗尔,玛丽娅·卡莎蕾,皮埃
  • 五帝三皇五帝是中国传说中的君主。从三皇时代到五帝时代,被称为传说时代,在夏朝之前。其历年无确数,最少数千年。近代考古在中原地区发现的裴李岗文化及贾湖文化等,从7000年前至1000
  • λ点λ点是氦从一般流体氦(I)相变到超流体氦(II)的温度,在1标准大气压下约为2.17 K。氦(I)和氦(II)可以共存的最低压力是在He气体−He(I)−He(II)的三相点,是在2.1768 K(−270.9732 °C
  • 陈 军陈军(1967年9月-)是一位中国无机化学家,南开大学教授。1967年出生于安徽宿松,1989年毕业于南开大学,1999年在澳大利亚伍伦贡大学获得博士学位。2017年当选为中国科学院院士。
  • 白人白人(英语:White people),或称白色人种,指狭义的高加索人种(一般亦作西洋人、西方人或西人、洋人),是以人类肤色命名的人种名称,一般指拥有淡色皮肤的种族或群体;或是一类拥有淡色皮肤