表征学习

✍ dations ◷ 2025-07-04 14:54:57 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 膳食补充剂营养补充品,又称营养补充剂、膳食补充剂、营养剂、饮食补充剂、保健食品、健康食品等,是一种成分是从食物中萃取对人体有益的营养素(如氨基酸、微量元素、维生素、矿物质等)的补
  • 肺表面活性物质肺表面活性物质(英语:Pulmonary surfactant),也称肺表面活性剂,是一种肺泡形成的表面活性脂蛋白复合体。表面活性物质一般具有亲和性不同的两端。在肺中,蛋白质和脂类形成同时具有
  • 痳疯麻风病(英语:Leprosy),又作麻疯、癞病、疠风,医学领域称为汉生病或韩森氏病(英语:Hansen's Disease),是由麻风杆菌与弥漫型麻风分枝杆菌引起的一种慢性传染病,主要经由飞沫传染但传染
  • 巴克敏斯特·富勒巴克敏斯特·福乐(Richard Buckminster Fuller,1895年7月12日-1983年7月1日),美国哲学家、建筑师及发明家 。曾在1946年取得戴美克森氏投影法的专利。富勒发表超过30本书,发明和普
  • Verizon威瑞森通信(Verizon Communications(/vəˈraɪzən/),NYSE:VZ),是美国一家主要电信公司,全球领先的宽带和电信服务提供商,道琼斯30种工业平均指数组成之一。公司总部位于纽约市,主要
  • 达美航空达美航空(英语:Delta Air Lines, Inc.,NYSE:DAL)是一家总部位于美国乔治亚州亚特兰大的航空公司,目前是世界上国内客运总里程与客运机队规模第二大的航空公司。达美航空为天合联盟
  • 马余刚马余刚(1968年3月-),生于浙江余姚,籍贯浙江宁海,中国核物理科学家。1968年3月生于浙江余姚,籍贯为宁海。1989年,于原杭州大学(后并入现浙江大学)物理系毕业。2015年,获国际华人物理与天
  • 贝塔斯曼贝塔斯曼(Bertelsmann SE & Co. KGaA),台湾译作博德曼,是总部位于德国居特斯洛的跨国媒体公司,涉足电视、广播,杂志报刊出版、音乐出版、印刷及媒体服务、书刊音乐俱乐部等。在全
  • 人均购买力平价这是一个各国人均国民总收入列表(购买力平价),世界银行提供。所有数据使用国际元统计。 非主权实体或特殊地区使用斜体表示。| style="text-align: left; vertical-align: top
  • Nasub5/subPsub3/subOsub10/sub三聚磷酸钠,化学式Na5P3O10。三聚磷酸钠是一种白色粉末,易溶于水,水溶液呈碱性,1%水溶液pH为9.7。有两种晶形,α型(高温型)和β型(低温型),两者化学性质相同,均可得到相同的水溶液和结晶