首页 >
表征学习
✍ dations ◷ 2025-10-30 23:13:10 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 核形虫纲核形虫纲(Cristidiscoidea或Nucleariae)是真菌总界下的一个演化支,与后孢菌(英语:Opisthosporidia)(真菌所属类群)为旁系群。由于核形虫接近,但又位于真菌与动物主要分支之外,对核形虫
- 狼狼(学名:Canis lupus),或称为灰狼,哺乳纲,犬科,在生物学上与狗为同一物种,为现生犬科动物中体型最大的物种。狼这个物种曾是地球上分布地区最广的哺乳动物,包括北美和欧亚大陆,但如今
- 西双版纳热带植物园中国科学院西双版纳热带植物园为中华人民共和国5A级景区,面积约900公顷,创建于1959年,由中国著名植物学家蔡希陶教授带领建造,位于葫芦岛上。园内保有大量热带雨林还有各种树木,
- 万维网万维网(英语:World Wide Web)亦作WWW、Web,是一个透过互联网访问的,由许多互相链接的超文本组成的系统。英国科学家蒂姆·伯纳斯-李于1989年发明了万维网。1990年他在瑞士CERN的
- 月经生理月经(英语:menstruation, period, monthly,古代叫做癸水,俗称姨妈到、好朋友、大姨妈、来M等),是指女性血液或黏膜定期从子宫内膜经阴道排出体外的现象。高达80%女性曾表示在月经
- 头部穿孔头部穿孔(Trepanation),又称颅骨穿孔术或环锯术,是一种外科手术干预法,在头皮与头盖骨上钻或挖一个孔,令到头颅的硬膜外露,以处理颅内疾病或其他相关的健康问题。人们相信这种方法
- 威廉·莫里斯威廉·莫里斯(William Morris,1834年3月24日-1896年10月3日),英国艺术与工艺美术运动的领导人之一。世界知名的家具、壁纸花样和布料花纹的设计者兼画家。他同时是一位小说家和诗
- 新国际百科全书《新国际百科全书》(英语:New International Encyclopedia),是1902年的一部美国百科全书,由Dodd, Mead and Company出版此书,并曾于1906、1914及1926年更新。《新国际百科全书》承
- 典型霍奇金氏淋巴瘤霍奇金氏淋巴瘤(英语:Hodgkin's lymphoma)又称霍奇金氏病、何杰金氏病,或何杰金氏淋巴瘤,为淋巴瘤的一型,是一种淋巴细胞的癌变,症状包含发烧、夜间盗汗(英语:Night sweats),以及体重减
- 驾驶舱驾驶舱(英语:Cockpit),是飞行员控制飞机的座舱,通常位于一架飞机的前端。除了早期的部分飞机,如今大部分飞机的驾驶舱采用密闭式的设计。飞机驾驶舱内一般安装有各类飞行仪表和飞
