表征学习

✍ dations ◷ 2025-11-25 09:31:44 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 轫致辐射轫致辐射,又称刹车辐射或制动辐射(英语:Bremsstrahlung, braking radiation, 德语:Bremsstrahlung 德语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Li
  • Oath威讯媒体公司(英语:Verizon Media),旧名Oath,是一家美国的网络媒体公司,为威讯通信(Verizon Communications)旗下子公司,也是AOL和Yahoo网络事业部门所属的母公司。威讯通信于2015年5
  • 英语拼写改革英语拼写改革是一系列更改英语拼写方法的运动的总称,它的目的是通过拼写改革使英语的拼写更加简单和有规律。这些有争议的、小规模的改革运动发生在爱好者和专业语言学家中,已
  • 过渡化石过渡化石是既保留有其祖先、也保留有其演进出的后代的生命形态的生物化石。 尤其是当其演进出来的生物与其祖先完全不同时,过渡化石在科学研究上的意义就显得更加重大。这种
  • 土壤力学土壤力学是应用土壤物理学(英语:Soil physics)和工程力学方法来研究土的力学性质的一门学科。土壤力学的研究对象是与人类活动密切相关的土和土体,包括人工土体和自然土体,以及与
  • 贝尔尼·阿尔德贝尔尼·朱利安·阿尔德(英语:Berni Julian Alder,1925年9月9日-),美国物理学家,研究方向为统计力学,他是物理学中数值模拟的先驱。
  • 火腿火腿(英语:Ham),是经过盐渍、烟熏、发酵和干燥处理的腌制动物后腿,一般用猪后腿。或是以猪、牛肉的肉泥,添加淀粉与食品添加剂,压制而成的“三明治火腿”。营养成分主要为蛋白质、
  • 英国国教英格兰教会(英语:Church of England),或译为英格兰国教会、英国国教会、英格兰圣公会,是基督新教圣公宗的教会之一,16世纪英格兰宗教改革时期,由英格兰君主亨利八世领导,由神学家托
  • 詹姆斯二世詹姆斯二世(1430年10月16日-1460年8月3日)苏格兰斯图亚特王朝国王。苏格兰国王詹姆斯一世之子。周岁生日前,詹姆斯二世的孖生兄长罗斯西公爵亚历山大(英语:Alexander Stewart, Duk
  • 巴士底广场巴士底广场(法语:Place de la Bastille)是法国首都巴黎的一个广场,是法国大革命的重要纪念地方。过去是巴士底狱所在地,直到攻占巴士底狱,随后在法国革命期间的1789年7月14日到179