表征学习

✍ dations ◷ 2025-11-24 20:43:00 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 古雅典古雅典是一个古希腊城邦。城邦时代,位于阿提卡平原,科林斯湾和爱琴海的汇流之地。核心是高地卫城,依靠阿瑞斯山,后来成为在阿提卡平原发展而成的城邦。雅典以前是一个普通的城邦
  • 盘尼西林青霉素(Penicillin,或音译盘尼西林)是指分子中含有青霉烷、能破坏细菌的细胞壁并在细菌细胞的繁殖期起杀菌作用的一类抗生素,是由青霉菌中提炼出的抗生素。青霉素属于β-内酰胺
  • 南半球南半球(英语:Southern Hemisphere)是指赤道以南的半个地球。南半球主要包括的地区有亚洲印度尼西亚南部、非洲中部及南部、大洋洲绝大部分、南美洲大部分、南极洲全部。在南半
  • 三磷酸鸟苷鸟苷-5'-三磷酸,(缩写GTP),系一类嘌呤类核苷三磷酸。它可以在DNA复制期间的DNA转录过程中作为RNA生物合成的底物。它的结构与含氮碱基鸟嘌呤相似,唯一的不同是GTP连有一个核糖基
  • 生物降解塑料生物可分解塑胶是可以在自然界降解的塑胶材质。在有足够的湿度、氧气与适当微生物存在的自然掩埋或堆肥环境中,可被微生物所代谢分解产生水和二氧化碳或甲烷,对环境危害较小。
  • 阿尔布瓦阿尔布瓦(法语:Arbois)是法国汝拉省的一个市镇,位于该省中部,属于隆斯勒索涅区。该市镇总面积45.42平方公里,2009年时的人口为3494人。阿尔布瓦因出产红酒而闻名。阿尔布瓦人口变
  • 韩布兴韩布兴(1957年7月-),中国物理化学家。生于河北遵化。1982年毕业于河北科技大学(原河北化工学院)化学工程系,1985年在中国科学院长春应用化学研究所获硕士学位,1988年在中国科学院化
  • 水通道水通道蛋白(Aquaporin),又名水孔蛋白,是一种位于细胞膜上的蛋白质(内在膜蛋白),在细胞膜上组成“孔道”,可控制水在细胞的进出,就像是“细胞的泵”一样。水通道是由约翰霍普金斯大学
  • 拉(Ra,也拼作Rah、Rē)是古埃及太阳神。从第五王朝(公元前2494年至公元前2345年)开始,成为古埃及神话中最重要的神,被看作是白天的太阳。一千多年以来,拉一直是埃及的最高神,直到阿肯
  • 后期圣徒运动后期圣徒运动(英语:Latter Day Saint movement)是从19世纪早期由美国东北部开始的宗教运动,普遍被认为是在该运动中被认为是先知的小约瑟·斯密开始的。这个运动是复原主义中的