表征学习

✍ dations ◷ 2025-11-23 20:19:00 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 埃莉诺·罗斯福安娜·埃莉诺·罗斯福(英语:Anna Eleanor Roosevelt,/ˈɛlᵻnɔːr ˈroʊzəvɛlt/,1884年10月11日-1962年11月7日)是一位美国政治人物。第32任美国总统富兰克林·德拉诺·罗斯
  • 科恩症候群科恩综合症是一种遗传病,其会导致婴幼儿时生长迟滞与低肌张力、青少年后中广型肥胖、重度到极重度智能障碍。其在阿米甚人的发生率约为1/15000,而其它地方则未明。遗传方面,其
  • 水俣公约《关于汞的水俣公约》(简称:《汞公约》英语:the Minamata Convention on Mercury)是一部全面对汞进行规制的国际公约。公约要求缔约国自2020年起,禁止生产及进出口含汞产品。2013
  • 原子半径原子半径通常指原子的尺寸,并不是一个精确的物理量,并且在不同的环境下数值也不同。 一个特定的原子的半径值和所选用的原子半径的定义相关,而在不同的环境下给原子半径不同定
  • 蜡疗蜡疗,属于物理治疗中热疗的一种。主要用于于治疗慢性关节炎,神经病变等。原理为使用石蜡包覆患部,传导热能以进行热疗。蜡疗在中国医学中已行之有年,《本草纲目/虫部》中记载:“
  • 创伤后心理压力紧张症候群创伤后压力综合征(Post-traumatic stress disorder,简称PTSD,又称创伤后遗症)是指人在经历过情感、战争、交通事故等创伤事件后产生的精神疾病。其症状包括会出现不愉快的想法、
  • 消旋酶消旋酶(英文:racemase),属于异构酶,能够催化生物分子中立体化学的反转。 消旋酶催化仅具有一个不对称中心的基质中的不对称碳原子周围的立体化学反转。 差向异构酶催化具有多于一
  • HBr溴化氢是化学式为HBr的二元化合物,标准情况下为气体。溴化氢溶于水得到氢溴酸,氢溴酸中加入失水剂也可得到溴化氢。标准情况下,溴化氢是不可燃气体,带有酸味,在潮湿空气中发烟。
  • 塞浦路斯问题塞浦路斯问题(希腊语:Κυπριακό (ζήτημα) , 土耳其语:Kıbrıs Sorunu)是位在地中海东部的塞浦路斯岛上,因为塞浦路斯岛上的希腊人及土耳其人族裔问题及是否南、北
  • 罗塞塔石碑罗塞塔石碑(英语:Rosetta Stone,又译为罗塞达碑),是一块制作于公元前196年的花岗闪长岩石碑,原本只是一块刻有古埃及法老托勒密五世诏书的石碑,但由于这块石碑同时刻有同一段内容的