表征学习

✍ dations ◷ 2025-10-29 08:37:36 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 喉头炎喉炎(Laryngitis)是描述喉部发炎的现象。喉为人体主要的发声构造,喉炎常见症状包含声音沙哑(英语:hoarse voice)、发烧、咳嗽、前颈疼痛,以及吞咽困难。症状通常会持续两周。喉炎可
  • 肾源性尿崩症2肾源性尿崩症(Nephrogenic diabetes insipidus (NDI))主要是源于肾脏病理的一种尿崩症。这是相对于中央/神经性尿崩症(neurogenic diabetes insipidus),神经性尿崩症是由抗利尿激
  • 作者作者指创作文学、艺术、科学等作品的人。从根本上说,只有自然人才能成为作者。然而法人和其他组织在特定条件下也能成为法律意义上的作者。例如作品的创作人受雇于某组织,为该
  • 父部,为汉字索引中的部首之一,康熙字典214个部首中的第八十八个(四划的则为第二十八个)。就繁体和简体中文中,父部归于四划部首。父部通常是从上方为部字。且无其他部首可用者将
  • 从化温泉从化温泉,位于中国广东省广州市从化区北部,广州-从化断裂北端。面积14.5平方公里,流溪河穿流其间,又称流溪河温泉。泉水附存于燕山期花岗岩裂隙中,沿流溪河两岸及谷底成带状分布,水
  • Sbsub2/subSsub5/sub五硫化二锑是一种锑和硫生成的化合物,不同于三硫化二锑,是一种非整比化合物,为深橙黄色粉末,不溶于水,常用于橡胶工业和制作兽药。可以用全硫代锑酸盐加酸来制备它。但是无法证明
  • 凯尔特人凯尔特人(英语:Celt,/kɛlts, sɛlts/),或译为塞尔特人、居尔特人、盖尔特人、克尔特人等。是公元前2000年活动在西欧的一些有着共同的文化和语言 (拉丁文)特质的有亲缘关系的民族
  • 沃思县沃思县(Worth County, Georgia)是美国乔治亚州南部的一个县。面积1,488平方公里。根据美国2000年人口普查,共有人口21,967人。县治西尔维斯特 (Sylvester)。成立于1853年12月20
  • 七星诗社七星诗社(法语:La Pléiade)是16世纪的一群法国诗人,他们力图按照希腊和拉丁语典范把法语和法国文学从中世纪的遗风中解放出来。七星诗社诗人中最著名的是比埃尔·德龙沙和约阿
  • 默克手册《默克手册》(英语:The Merck Manuals)默克制药公司出品的医学参考书,涵盖范围广泛的医疗相关课题,包括疾病、测试、诊断和药物。这些手册最初是以书本形式发行,现已转化为网上的