表征学习

✍ dations ◷ 2025-11-28 05:43:40 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 胸管胸腔闭式引流术,又称“胸廓造口术、胸腔管手术”,是一种较为简单的外科手术。一般用于治疗各种胸腔积水、胸腔积液(英语:pleural effusion)和气胸等。过程是先进行局部麻醉后,在肋
  • 三立新闻三立新闻台(英语:SET News Channel),简称“三立新闻”,是台湾三立电视旗下的电视新闻频道,1998年3月3日开播,是台湾多家24小时即时播出的新闻频道之一。原名SET电视台,后改为SETN,200
  • 日文日语书写系统汉字假名使用罗马字日文是指为了用文字来记载日语文章等的系统方法。现代日文由几种文字构成:起源于中国形意文字的汉字;表音文字(音节文字)平假名(文法型式上也常用
  • 成药非处方药(over-the-counter (OTC) drug),又称为成药,指的是未经处方而可以从药店购买得到的药品,与处方药相对。这些药品临床应用时间较长、药效确定、药物不良反应较少,患者不须
  • 土 (消歧义)土,即土壤,是一种自然体,由数层不同厚度的土层所构成,主要成分是矿物质。土还可以指:
  • 牛顿县牛顿县(Newton County, Georgia)是美国乔治亚州北部的一个县。面积723平方公里。根据美国2000年人口普查,共有人口62,001人,2005年人口86,713人。县治科文顿(Covington)。成立于18
  • 古吉拉特古吉拉特邦(古吉拉特语:ગુજરાત,拉丁字母转写:Gujarat,旧译瞿折罗、胡茶辣)是位于印度最西部的邦。该邦西部和西南部紧邻阿拉伯海,北部与巴基斯坦信德省和拉贾斯坦邦相接壤,南
  • 分割谬误分割谬误(Division Fallacy)是一种非形式谬误,是基于整体拥有某性质,而推论其中的部分或全部个体都具备该性质,这是一种以全概偏。相对地则有合成谬误:某物的某部分具有某性质,故某
  • 伯克希尔县伯克希尔县(英语:Berkshire County)是美国马萨诸塞州最西部的一个县,西邻纽约州,南邻康乃狄克州,北邻佛蒙特州。面积2,451平方公里。根据美国2000年人口普查,共有人口134,953。县治
  • 玛丽·沃斯通克拉夫特玛丽·沃斯通克拉夫特(英语:Mary Wollstonecraft,1759年4月27日-1797年9月10日),18世纪的英国作家、哲学家和女权主义者。她在短暂的写作生涯中,完成了多篇小说和论文、一本旅行书