首页 >
表征学习
✍ dations ◷ 2025-12-06 16:07:53 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 温泉温泉(英语:hot spring)是一种由地下自然涌出的泉水,其水温较环境年平均温高摄氏5度,或华氏10度以上。在学术上,涌出地表的泉水温度高于当地的地下水温者,即可称为温泉。温泉的形成
- 出生率在人口统计学中,出生率(crude birth rate,CBR)的定义是每年、每一千人当中的新生人口数,可以数学式表达为:C B R = n
- 肥大细胞肥大细胞(mast cell),发育源于骨髓CD34+前体细胞,是连接神经系统和免疫系统的桥梁,因为靠近周围神经末梢而很早就可以感受神经纤维的活动。肥大细胞激活后,可以释放炎症因子并募集
- 急性肾损伤急性肾损伤(Acute kidney injury、AKI、以前称为"急性肾衰竭"(acute renal failure、ARF)、急性肾功能衰竭),通常在7天内肾脏发展为肾功能突然损失掉。其原因是多方面的。通
- 执照执照旧时指官府所发的文字凭证,今指由行政主管机关应公民、法人或其它组织的申请,对符合法定条件的申请人依法发给的准许从事某种行业、工作或特殊活动的正式凭证,是许可证的一
- 贵霜帝国贵霜帝国(梵语:कुषाण राजवंश;巴克特里亚语:.mw-parser-output .Polytonic{font-family:"SBL BibLit","SBL Greek","EB Garamond","EB Garamond 12","Foulis Greek",C
- 利比威拉德·弗兰克·利比(英语:Willard Frank Libby,1908年12月17日-1980年9月8日),美国化学家,1960年诺贝尔化学奖得主。利比于1940年代于芝加哥大学发明了放射性碳定年法,该方法对考
- 侗族大歌侗族大歌(侗语:al laox ,汉语音为“嘎老”,意为“宏大的歌”),是中国侗族民间多声部合唱音乐的总称。侗族大歌具有多个各歌种,按风格、旋律、内容等可分为鼓楼大歌、声音大歌、儿童
- 加西亚阿方索·加西亚·罗夫莱斯(1911年3月20日-1991年9月2日)是一名墨西哥外交官和政治家,在1982年,他与瑞典的阿尔瓦·米达尔共同获得诺贝尔和平奖。他出生于米却肯州的萨莫拉,在加入
- 前东部领土德国前东部领土(德语:ehemalige deutsche Ostgebiete)或德意志帝国东部领土(德语:Ostgebiete des Deutschen Reiches)是指位于奥得河-尼斯河线以东,曾经得到国际公认属于德国领土一
