首页 >
表征学习
✍ dations ◷ 2025-11-26 03:56:47 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 金刚乙胺金刚乙胺(Rimantadine)是一种抗病毒药,属于三环胺类,对A型流感病毒有预防和治疗作用,且作用强于金刚烷胺。金刚乙胺的中枢神经副作小于金刚烷胺。金刚乙胺通过抑制特异蛋白的释放
- 碳水化合物糖类(Carbohydrate)又称碳水化合物,是多羟基醛或多羟基酮及其缩聚物和某些衍生物的总称,一般由碳、氢与氧三种元素所组成,广布于自然界。糖类的另一个名称为“碳水化合物”,其由来
- 正子断层扫描正电子发射计算机断层扫描(英语:Positron emission tomography,简称PET)是一种核医学临床检查的成像技术。PET技术是当前唯一的用解剖形态方式进行功能、代谢和受体显像的技术,具
- 复活节复活节(拉丁语:Pascha),又称主复活日,是基督宗教的重要节日之一,最初定在犹太人逾越节之后的星期日,但教会在4世纪第一次尼西亚公会议决议不用犹太历,于是改定为每年春分月圆之后第
- 西三角经济圈西三角经济圈,全称为西部川陕渝金三角,是一个设计中的经济区;总面积22万平方公里,人口1.18亿,包含47座城市,GDP总额1.5万亿元人民币,占中国的6.3%,整个西部的33%。此方案已提请中国
- 中国传统节日饮食 - 服饰 - 建筑 - 文物 - 节日 - 教育 科学 - 五术(医学 - 术数) - 武术汉族传统节日或称为中华传统节日、汉人传统节日。这些节日是汉人随着季节、时间和物候转移,开展具
- 豆瓣酱豆瓣酱是由各种微生物相互作用豆制品,产生复杂生化反应,而酿造出来的一种发酵红褐色调味料,它是以黄豆或是蚕豆和面粉为主要生产原料,同时,又根据消费者的习惯不同,在生产豆瓣酱中
- 非特异性症状人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学症状(英语:symptom)又称病状,医学术语,在疾
- 蜂王浆蜂王浆(英语:Royal jelly),又称蜂皇浆、蜂王乳等,是工蜂的一种分泌物,喂食蜂后的食物。蜂王浆是由蜂群中的哺育工蜂以其舌腺和上颚腺等腺体分泌的浆状物,初出生的蜂幼虫只要一直食
- 亲核体亲核体,又叫亲核基、亲核试剂(英语:Nucleophile,意思为原子核的喜好物)是一个基本的有机化学概念,指具有亲核性的化学试剂,可用:Nu表示。它用来衡量一个试剂给电子能力的强弱。一般
