表征学习

✍ dations ◷ 2025-12-05 01:50:09 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 专性需氧专性需氧微生物(英语:obligate aerobe)是一类在有氧条件下才能存活的微生物。这类生物通过有氧呼吸将糖类或脂肪转化为其生活所需的能量,在其呼吸中,氧被用作电子传输链的末端电
  • 信息经济信息经济是一个松散的名词,用来描述随着信息活动和信息产业增加的一种经济。当前并没有关于信息经济的共同定义。这是由于事实上研究者只关心部分信息活动的增加,而不是它有无
  • WebCiteWebCite,是一个网络存档(英语:web archiving)服务网站,可以存档网页后会生成一个永久的存档网页链接地址。使用WebCite的话,如果原始页面被移动、更改或删除,读者可以透过保留一个
  • 精细胞配子(英语:Gamete)是单倍体细胞,它由行有性生殖的生物在特定的器官通过减数分裂产生。两性配子通过配子结合 产生合子。有性生殖的好处是遗传讯息的重组,这也是物种内遗传信息的
  • 脂质粒脂质粒(英语:Liposome)也称为微脂粒,是一种具有靶向给药功能的新型药物制剂。脂质粒是利用磷脂双分子层膜所形成的囊泡包裹药物分子而形成的制剂。由于生物体质膜的基本结构也是
  • 马伯利诉麦迪逊案马伯利诉麦迪逊(Marbury v. Madison,5 U.S. 137 (1803))是美国最高法院于1803年判决的一个案例。庄园主马伯利由于上届政府的疏忽,而未收到“太平绅士”的委任状,而继任政府的国
  • dGDP去氧鸟苷二磷酸(Deoxyguanosine diphosphate;dGDP)是较为常见的核酸GTP之衍生物,比GTP少了一个位在五碳糖2号碳上的-OH基,含有两个磷酸基团。
  • 龙岩市龙岩市(闽南语白话字:Lêng-nâ-chhī;客语白话字:Liùng-ngâm-sṳ),通称闽西,是中华人民共和国福建省下辖的地级市,位于福建省西南部。市境北接三明市,东达泉州市,东南界漳州市,西南
  • 两侧对称两侧对称动物(学名:Bilateria),又名左右对称动物,与辐射对称动物(Radiata)共同组成真后生动物(Eumetazoa)。两侧对称动物的身体由三层胚层发育而来,即拥有中胚层。三胚层是由两胚层演
  • 乙酸乙酯乙酸乙酯是乙酸中的羟基被乙氧基取代而生成的化合物,结构简式为CH3COOCH2CH3。乙酸乙酯是无色易燃易挥发的液体;有特殊香味;微溶于水,易溶于有机溶剂。乙酸乙酯可由乙酸、乙酸酐