表征学习

✍ dations ◷ 2025-12-02 11:41:48 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 心包络心包络,又称心包,亦称“膻中”,是包在“心”外面的膜,有保护心的作用。心包络既是心的外围,所以邪气犯心,通常先会侵犯心包络。心包在中医脏腑学说与三焦互为脏腑。
  • 闪米特语族闪米特语族,译作閃語族、塞姆语族或閃米特語族 ,旧称叙利亚-阿拉伯语族,是亚非语系之下的语族之一,起源于中东地区,其下属语言约有3.3亿人作为母语,分布于西亚、北非和非洲之角,也
  • 语义元语义元,或称语义素,是在先天上能够直接理解而无法以更简化的用词来表述的一组语义的概念。语义元能够表述透过后天习得,但不能被具体定义的单词或短语。 例如,英语 "touch" 最直
  • 系词系词(英语:copula、复数为copulas或copulae、英文简称:cop),又译为系动词、联系动词,在语言学上为表示用于与谓词(主语补语)链接一个句子之主词的字词,比如在一个句子"The sky is blu
  • 伦巴第-威尼斯王国伦巴第-威尼托王国(意大利语:Regno Lombardo-Veneto,德语:Lombardo-Venezianisches Königreich)是一个位于意大利北部的王国,并由当时的奥地利帝国所控制。此王国是根据欧洲列强
  • 3-磷酸甘油酸3-磷酸甘油酸(英语:3-phosphoglycerate, 3PG或glycerate 3-phosphate GP)是生物细胞中常见的分子之一,也是糖解作用与卡尔文循环过程里的中间产物。(注:在卡尔文循环当中简写为PG
  • 溴化镁溴化镁,化学式MgBr2,是由溴和镁组成的白色或无色易潮解物质。通常在治疗神经紊乱中用作镇静剂或抗痉挛药物。 溴化镁溶于水,部分溶于乙醇。在水氯镁石或光卤石中存在少量。亦可
  • 单一市场共同市场(英语:Common market)或称单一市场(英语:Single market)。经济一体化的主要阶段并举例说明优惠贸易安排:在实行优惠贸易安排的成员间,通过协定或其他形式对全部商品或部分商
  • 杨玉良杨玉良(1952年-),浙江海盐人,中国化学家,复旦大学教授,中国科学院院士。曾任复旦大学校长。1952年,杨玉良出生于浙江省嘉兴市海盐县。1977年,获得复旦大学化学系高分子化学与物理专业
  • 星座{{Otheruses|西洋占星术|subject=天文学上所指的[[天球名都不尽相同。星座一直没有统一规定的精确边界,直到1930年,国际天文学联合会为了统一繁杂的星座划分,用精确的边界把天