首页 >
表征学习
✍ dations ◷ 2025-11-28 19:22:09 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 病毒包膜一个位于宿主细胞之外的独立、功能完全的病毒颗粒一些病毒拥有的包裹病毒体的脂肪泡一段DNA或RNA。如果把核苷酸比作字的话,那么基因就是由核苷酸写成的句子。基因会指导病毒
- 长寿命裂变产物长寿命裂变产物一般指由核裂变反应产生的、半衰期超过20万年的放射性物质。这并非精确的科学定义,比如有人把某些半衰期在20年至100年间的裂变产物也称作长寿命裂变产物。另
- 获验证的最长寿者列表此列表为经吉尼斯世界纪录验证的最长寿者列表,至今为止,人类史上最长寿者为法国女性雅娜·卡尔曼特,122岁164天(也是至今唯一一位120岁及以上);现任全世界最长寿在世人物是日本女
- 丹尼索瓦人丹尼索瓦人(学名未定,暂时名称为Homo sp. Altai或Homo sapien ssp. Denisova)是人属内一个已经灭绝、经由古人类化石的DNA所发现的人种。可能在更新世晚期生活于亚洲大陆。2008
- 上位于脊柱的椎管内且被脊椎保护;是源自脑的中枢神经系统延伸部分。中枢神经系统的细胞依靠复杂的联系来处理传递信息。脊髓主要负责躯干和四肢的反射动作,及传送脑与外周之间的
- 未成年人未成年人(未成年者或未成人)是一个社会学或者法学的概念,即是还没有成年的人。在很多国家的法律上,未成年人即是未满法定成年年龄18岁的人。不同的社会或地区对未成年人在心理状
- 塔恩-加龙省塔恩-加龙省(法文:Tarn-et-Garonne)是法国朗格多克-鲁西永-南部-比利牛斯大区所辖的省份。该省编号为82。5个海外省及大区
- 生活质素马斯洛的需求金字塔上达到越高层的人可以视同生活质量越高自我实现的需求尊重需求(社会承认需求)社交需求(社会关系需求)安全的需求生理的需求(身体基本需求)生活质量(Quality of L
- 莫斯科大公国莫斯科公国(俄语:Великое Княжество Московское,罗马化:Velikoe Knjažestvo Moskovskoe;英语:Grand Duchy of Moscow),准确翻译为莫斯科大亲王国,是一个
- 赤藓醇赤藓醇(英语:Erythritol,(2R,3S)-丁-1,2,3,4-四醇)或称赤藻糖醇,是一种存在于葡萄、梨子等果实或酱油、味噌、清酒等发酵食品中的天然糖醇(或者多元醇)。具有砂糖60-80%的糖度。
