首页 >
表征学习
✍ dations ◷ 2025-11-30 11:49:31 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 赫西俄德赫西俄德(希腊语:Ἡσίοδος)是古希腊诗人,他可能生活在前8世纪。从前5世纪开始文学史家就开始争论赫西俄德和荷马谁生活得更早,今天大多数史学家认为荷马更早。被称为“希腊
- 意大利半岛意大利半岛(意大利语:Penisola italiana),又名亚平宁半岛 (Apennines)(意大利语:Penisola appenninica)是南欧洲三大半岛之一,位居三大半岛的中间,在地中海之北。亚平宁半岛北起波河
- 波斯尼亚和黑塞哥维那波斯尼亚和黑塞哥维那国家和大学图书馆(NUBBiH,Nacionalna i univerzitetska biblioteka Bosne i Hercegovine)是波斯尼亚和黑塞哥维那的国家图书馆,位于萨拉热窝。图书馆修建于
- 环节动物门环节动物门(学名:Annelida)是动物界的一个门,该门动物为两侧对称、同律分节的裂生体腔动物,有的具疣足和刚毛,多闭管式循环系统、链式神经系统。常见环节动物有:蚯蚓、蚂蟥(又称水蛭
- UpToDateUpToDate, Inc.(bip)是威科集团的 Wolters Kluwer Health部门下的公司,其主要产品是UpToDate,是可以提供照护点(英语:point-of-care)医疗资讯的软件系统。也在中国大陆推出了UpToDa
- 星际物质在天文学,星际物质(ISM)是存在于星系的恒星系统之外,在太空中的物质和辐射。这些物质的形式包括电离的气体、原子、和分子,以及宇宙尘和宇宙射线。它们填充了星际空间,并且顺利地
- 查谟和克什米尔查谟和克什米尔(Jammu and Kashmir)是一个位于印度北部的中央直辖区,分为查谟和克什米尔山谷两个专区,为印度控制的克什米尔的一部分。该地南面与旁遮普和喜马偕尔邦接壤,东北部
- 自我意识异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
- 萜类萜烯(英语:terpene,简称萜,旧称䓝,词由松节油“turpentine”而来)是一系列萜类化合物的总称,属脂类,不溶于水,是分子式为异戊二烯(C5H8)的整数倍的烯烃类化合物。萜烯是一个庞大而多样
- 热固性塑料热固性聚合物(英语:Thermosetting polymer,又称为热固性塑料)指具有加热后固化并且不可溶解,不融化特性的塑料,例如环氧树脂。这种塑料只可以成型一次。脲甲醛(Urea-formaldehyde)
