表征学习

✍ dations ◷ 2024-12-22 23:34:53 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • ATP三磷酸腺苷(英语:adenosine triphosphate, ATP;也称作腺苷三磷酸、腺嘌呤核苷三磷酸)在生物化学中是一种核苷酸,作为细胞内能量传递的“分子通货”,储存和传递化学能。ATP在核酸合
  • 副甲状腺甲状旁腺或称甲状旁腺(英语:parathyroid gland)是脊椎动物的一种内分泌腺,主要调节体内的钙和磷代谢。人类和一些真兽类的甲状旁腺与甲状腺有一定解剖学位置关系,在其他动物的甲
  • 先天性疾病先天性障碍,又称先天性疾病、先天畸形、先天缺陷,是指发育中的胎儿因为遗传性疾病或发育环境等因素导致某个部位特征结构畸形,导致在婴儿出生时即有的病症,包括了身体(英语:Physic
  • 心包膜心包,又名心膜,是一个圆锥形双层纤维浆膜囊,包裹心脏和出入心脏大血管根部。心包的两层分别为:心包的学名pericardium来自希腊语的περι(环绕、周围)与κάρδιον(心脏)两字
  • 科学心理学异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
  • McKinsey Company麦肯锡公司(英语:McKinsey & Company,简称麦肯锡)为一所由芝加哥大学会计系教授詹姆斯·麦肯锡创立于芝加哥的管理咨询公司,营运重点是为企业或政府的高层干部献策、针对庞杂的经
  • 胸大肌胸大肌为将手臂拉向胸部的肌肉,两块胸大肌位于胸的两侧。胸大肌通常称为胸肌或胸脯,成扇型,且分裂为大小不等两部分。在其窄端,两部分都附着于肱骨之上,在宽的一端,较小的部分附于
  • 卡尺卡尺也称卡钳,是用来测量物体两点或两对立面(如内外径、物体厚度等)之间距离用的一种测量工具。最简单的卡尺为圆规状,顶部有向外或向内的尖端。卡尺的顶端可以手动调整,直至与所
  • 宣告记忆陈述性记忆(英语:Declarative memory,又名述说记忆、宣告记忆),有时也被称为外显记忆(Explicit memory),是人类长时记忆形式的一种。它指的是能够明确想起某个事件或事实的一种记忆
  • 法兰西斯·哈奇森弗兰西斯·哈奇森(英语:Francis Hutcheson,1694年8月8日-1746年8月8日)是一位爱尔兰哲学家也是苏格兰启蒙运动的奠基者之一。哈奇森对苏格兰启蒙运动的几位思想家,包括亚当·斯密