表征学习

✍ dations ◷ 2025-12-05 17:28:57 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 质谱法质谱(英语:mass spectrometry,缩写:MS)是一种电离化学物质并根据其质荷比(质量-电荷比)对其进行排序的分析技术。简单来说,质谱测量样品内的质量。 质谱法被用于许多不同领域,并被用
  • 光谱学光谱学(英语:Spectroscopy)是研究物质发射、吸收或散射的光、声或粒子来研究物质的方法。光谱学也可以被定义为研究光和物质之间相互作用的学科。历史上,光谱学指用可见光来对物
  • 太极太极是中国思想史上的重要概念,主要继承自《周易》:“易有大恒,是生两檥。两檥生四马,四马生八卦。”(马王堆出土本),故改“恒”为“极”,而四马同时改为四象。“太”与“大”古时相
  • H-术语危险说明是全球化学品统一分类和标签制度(GHS)的一部分。它们旨在形成一套关于化学物质和混合物危害的标准化短语,可以翻译成不同的语言。 因此,它们与众所周知的R-短语具有相同
  • 阿基米德原理阿基米德原理,基于翻译问题,可能是指以下由阿基米德发现或以阿基米德名之的自然规律:
  • 威尔士党威尔士党(Plaid Cymru – the Party of Wales,“Plaid Cymru”是威尔士语,“the Party of Wales”是英语,意思都是“威尔士党”),是英国威尔士的一个地方政党。现在以在欧盟中建立
  • 爱德华多·奇利达爱德华多·奇利达(西班牙语:Eduardo Chillida,巴斯克语:Eduardo Txillida,1924年1月10日-2002年8月19日)是巴斯克地区出身的西班牙当代雕塑家。1924年1月10日出生于吉普斯夸省圣塞
  • 库尔德斯坦爱国联盟库尔德斯坦爱国联盟(库尔德语:یەکێتیی نیشتمانیی کوردستان / Yeketî Niştîmanî Kurdistan‎‎),简称库爱盟(PUK),伊拉克库尔德斯坦的一个库尔德人政党
  • 加尔米施-帕滕基兴加米施-帕滕基兴(德语:Garmisch-Partenkirchen)是位于德意志联邦共和国南部巴伐利亚州的一个城市。总面积205.67平方公里,总人口26178人,其中男性12193人,女性13985人(2011年12月31
  • ACU英联邦大学协会(英语:Association of Commonwealth Universities,缩写:ACU)是一个英联邦体系的国家之下,有480余所成员大学的教育相关组织,其宗旨是“我们为我们的成员机构服务,以提