首页 >
表征学习
✍ dations ◷ 2025-12-03 06:42:32 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 妊娠妊娠(英语:pregnancy),又称怀孕,是指胚胎或胎儿(英语:Offspring)在哺乳类雌性体内孕育成长的过程,而在哺乳动物中研究得最详细的是人类的妊娠。人类的妊娠约40周,从受精排卵算起则为38
- 古印第安人古印第安人是指最初进入美洲并定居的人,时间在美洲大陆的更新世时期晚期的后冰川时期。“古印第安人”一词特指西半球的石器时代,不同于旧石器时代(Paleolithic)。有证据表明在
- 武汉市金银潭医院武汉市金银潭医院是一家位于中华人民共和国湖北省武汉市东西湖区的一家公立医院,是武汉市卫生健康委员会直属单位,三级甲等专科医院。武汉市金银潭医院是湖北省和武汉市突发公
- 独立承揽人一个独立合同人是一个通过一个固定的合同向第三方提供商品或服务的自然人或企业 ,与雇员不同,独立合同人并不有规律地为雇主工作,但会依照代理法在必要的时候为合同方工作。通
- 未解读文字未解读文字(undeciphered writing systems)是指人类还未能解读的文字。其中有些文字声称已经被解读,但没有被独立的研究者所确认。有些文字系统,虽然有象征意义,但可能不是文字。
- 六氯苯六氯苯是有6个氯取代基的苯,一开始是被做为榖物防霉菌的使用,但也可以用在工业用途上,不过这个用品在斯德哥尔摩公约中属于被全球禁用的持久性有机污染物。在纯用品是无色细针
- 惠普惠烈-普克公司(英语:Hewlett-Packard Company、HP,简称惠普;NYSE:HPQ),是一间总部设在美国加州帕罗奥图的跨国科技公司。惠普公司主要研发,生产和销售笔记本电脑、一体机、台式机、平
- 克劳福德县克劳福德县(Crawford County, Georgia)是美国乔治亚州中西部的一个县。面积846平方公里。根据美国2000年人口普查,共有人口12,495人,2005年人口12,874人。县治诺克斯维尔 (Knoxv
- 华里丝·辛普森华里丝·辛普森也译作沃利斯·辛普森(英语:Wallis Simpson,本名:Bessie Wallis Warfield,1896年6月19日-1986年4月24日),是英国国王爱德华八世的女友,在后者退位为温莎公爵后成为其夫
- 聚光太阳能热发电聚光太阳能热发电(或称聚焦型太阳能热发电,英语:Concentrated solar power,缩写:CSP)是一个集热式的太阳能发电厂的发电系统。它使用反射镜或透镜,利用光学原理将大面积的阳光汇聚
