首页 >
表征学习
✍ dations ◷ 2025-12-04 19:57:44 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 纳米纳米为微米的千分之一倍(符号 nm,英式英文:nanometre、美式英文:nanometer,字首 nano 在希腊文中的原意是“侏儒”的意思),是一个长度单位,指1米的十亿分之一(10-9m)。有时候也会见到
- 实证医学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学实证医学(英语:Evidence-based medicine
- IgE免疫球蛋白E(英语:Immunoglobulin E,简称IgE)是一类只发现于哺乳动物内的抗体,是正常人血清中含量最小的免疫球蛋白。免疫球蛋白E由黏膜下淋巴组织中的效应B细胞合成,IgE的单体由
- 天王补心丸天王补心丹是中医药学传统方剂。同名方约有9首。《校注妇人良方》卷六:人参(去芦)、玄参、丹参、茯苓、远志、桔梗各五钱,生地黄四两,当归酒浸、五味、天门冬、麦门冬去心、柏子
- 二氧化氯二氧化氯是黄绿色的气体,是氯的最稳定的氧化物,也是唯一大量生产的卤氧化物。二氧化氯在其液态时稳定,但若和一些特定物质接触,也有爆炸的可能。 它在约−59°C 时凝结成亮橙色
- 最佳实践最佳实践(best practice)是一个管理学概念,认为存在某种技术、方法、过程、活动或机制可以使生产或管理实践的结果达到最优,并减少出错的可能性。最佳实践还常常被咨询公司、研
- 物理学重要著作这些是物理上的重要著作列表,按领域排列。这些著作被认为是重要的原因如下:1.电荷会产生电场(库仑定律) 2.磁场的变化会产生电场(法拉第电磁感应定率) 3.单独的磁极并不存在 4
- 2010年红场阅兵2010年红场阅兵于2010年5月9日在俄罗斯首都莫斯科举行。这次庆典是为了庆祝65年前的1945年,纳粹德国投降和苏联卫国战争的胜利。2010年的庆典阅兵式是自1991年苏联解体后规模
- 蚀刻蚀刻是指以酸性、腐蚀性或有研磨效用的物质在玻璃表面上创作的技术。传统上,这段过程是在玻璃吹制好或铸好之后进行的。1920年代,人们发明一种新的模刻技术,即将图案直接刻在铸
- 英国圣公会英格兰教会(英语:Church of England),或译为英格兰国教会、英国国教会、英格兰圣公会,是基督新教圣公宗的教会之一,16世纪英格兰宗教改革时期,由英格兰君主亨利八世领导,由神学家托
