表征学习

✍ dations ◷ 2025-01-23 02:05:11 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 美洲原住民美洲原住民,是对美洲所有原住民的总称。美洲原住民中的绝大多数为印第安人,剩下的则是主要位于北美洲北部的因纽特人。美洲原住民属于东亚人种美洲支系,与现代东亚人有共同的祖
  • 有孔虫界有孔虫界(学名:Rhizaria)为原生生物的一条主线。它们的形态差别很大,但主要部分均为变形虫状(amoeboid)并有丝状、网状或小管型支撑的假足。它们部分会制造可能有复杂结构的外壳或
  • 肛门癌肛门癌(anal cancer)是在肛门(英语:human anus)的癌症,是位在消化道远端开口处的癌症。肛门癌和更常见的大肠癌是不同的病症。肛门癌一般是在鳞柱交界区附近的肛门鳞状细胞癌,多半
  • 北京大学医学部北京大学医学部,简称“北医”,英文简称“PKUHSC”,是北京一所以医药卫生为主的高等院校,位于北京市海淀区学院路38号,原名北京医科大学,2000年5月4日并入北京大学。北医前身是国立
  • 葛洪葛洪(283年-343年),字稚川,号抱朴子,人称葛仙翁,丹阳句容(今属江苏)人,是晋朝时代的阴阳家,医学家、博物学家和制药化学家,炼丹术家,著名的道教人士。他在中国哲学史、医药学史以及科学史
  • 目的“目标”是一种个人或是系统想要达到的结果,而且会为此计划,设法达成。目标是个人或组织在某种理想状态下希望达到的状态。有时目标会有其期限(英语:time limit),因此还需要在期限
  • Zincke反应Zincke反应(Zincke reaction),以 Theodor Zincke 的名字命名。吡啶类与2,4-二硝基氯苯和伯胺反应,转变为吡啶盐。反应首步为N-2,4-二硝基苯基吡啶盐的生成。这个中间体一般分离
  • 瓣胃重瓣胃是反刍动物的第三个胃,也叫瓣胃,反刍后的食物会直接进入重瓣胃继续消化。重瓣胃内壁的瓣褶成书页状,内含消化酵素,能将植物纤维分解成葡萄糖,运送到肠脏吸收。牛的瓣胃又称
  • 短路短路(Short circuit)是指在正常电路中电势不同的两点不正确地直接碰接或被阻抗(或电阻)非常小的导体接通时的情况。短路时电流强度很大,往往会损坏电气设备或引起火灾。 电力系统
  • 按蚊见内文疟蚊属(学名:Anopheles),别称按蚊或马拉利亚蚊,是蚊科(Culicidae)下的一属,成虫的特征是翅膀大多数有斑,停留时身体与停留面保持一角度。其中有30—40种是疟原虫属生物的寄主,会