表征学习

✍ dations ◷ 2025-10-08 18:03:55 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 内耳性眩晕病美尼尔氏综合症(Ménière's disease)是内耳的疾病,其症状是会突然眩晕、耳鸣、听力减损,而且耳朵有肿胀感。最典型的症状是一开始只有单侧耳朵有症状,不过后来可能双耳都受到影
  • 单一主神教单一主神论(英语:Henotheism),源自希腊语的“'ἑνας θεός”(henas theos,意为“单一神”),也称单一神教、尊一神论、单一神论、或单一多神论,是指对某单一神的崇拜,且此种崇拜
  • 苯二酚苯二酚(benzenediol)即二羟基苯(dihydroxybenzene),苯分子中两个氢原子被两个羟基取代后的衍生物。化学式为C6H4(OH)2,有以下三个异构体:邻苯二酚间苯二酚对苯二酚这三种二元酚的性
  • 社区园艺社区农圃亦称社区花园或社区园圃,为让社区居民进行园艺与农事耕作的场地。社区农圃鼓励了城市社区的食品安全,让居民们可以种植作物供自己或捐给他人食用。农圃还可以避免人们
  • RTLRTL可以指:
  • 三官大帝三官大帝,指的是道教中掌管天界(天府)、地界(地府)、水界(水府)三界之神天官、地官和水官,闽南语俗称“三界公”,客家话称为“三界爷”,又称“三元大帝”。三位神明掌握三界间的一切行
  • 精神虐待精神虐待,是虐待的一种,指一个人导致其他人出现心理创伤、焦虑症、创伤后心理压力紧张综合症等心理伤害。这些虐待常常与权力不衡的场所有关连,例如欺凌、虐儿和工作场所欺凌等
  • 弗兰克·沃生·戴森弗兰克·沃生·戴森爵士(英语:Frank Watson Dyson,1868年1月8日-1939年5月25日),KBE、皇家学会会员、爱丁堡皇家学会院士,英国天文学家、皇家天文学家。他引入了英格兰格林威治时间
  • 离散几何学离散几何和组合几何是研究离散几何对象的组合性质和构造方法的几何学的分支。离散几何的大多数问题涉及到基本几何对象的有限集合或离散空间,比如点,线,平面,圆,球,多边形和四维空
  • 零假设在推论统计学中,零假设(英语:null hypothesis,又译虚无假设、原假设,符号: H 0