表征学习

✍ dations ◷ 2025-11-29 15:54:24 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 干燥性角结膜炎干眼症(英语:Dry eye syndrome, DES),又名干性角结膜炎(keratoconjunctivitis sicca, KCS),是一种眼睛干涩的状态。其他的症状包括眼睛过敏、发红、多眼屎或是容易疲劳,也可能出现视
  • 代谢途径代谢途径(英语:metabolic pathway)在生物化学中,是一连串在细胞内发生的化学反应,并由酶所催化,形成使用或储存的代谢物,或引发另一个代谢途径(称为“流量控制反应”)。多种途径都是
  • 喀山大学喀山国立大学(俄语:Казанский государственный университет)成立于1804年11月5日,由当时沙皇亚历山大一世签署批文,位于俄罗斯鞑靼斯坦共和
  • 汤(约前17世纪-前16世纪),商朝开国之君,子姓,名履,今人多称商汤,又称武汤、天乙、成汤、成唐,商代金文和甲骨文称为唐、成、大乙(太乙),又称高祖乙,原商部落首领,与有莘氏通婚后,任贤臣伊尹
  • RNA测序核糖核酸测序,简称RNA测序(英语:RNA Sequencing,英文简称RNA-Seq,也被称为全转录物组散弹枪法测序 Whole Transcriptome Shotgun Sequencing,简称WTSS)是基于第二代测序技术的转录
  • 阿尔伯特·克劳德阿尔伯特·克劳德(德语:Albert Claude,1899年8月24日-1983年5月22日),比利时生物学家,1974年因为对细胞构造的研究,而与他的学生克里斯汀·德·迪夫及乔治·帕拉德共同获得诺贝尔生
  • 大里区大里区(台湾话:.mw-parser-output .sans-serif{font-family:-apple-system,BlinkMacSystemFont,"Segoe UI",Roboto,Lato,"Helvetica Neue",Helvetica,Arial,sans-serif} Tāi-
  • 金红光金红光(1957年5月-),黑龙江延寿人,中华人民共和国科学家、中国科学院院士。毕业于东北电力学院动力系。1985年7月,获中国科学院工程热物理研究所硕士,之后供职于中国科学院工程热物
  • 小城市小城市(日语:小城市/おぎし Ogi shi */?)是位于日本佐贺县中央地区的城市。于2005年3月1日由小城郡辖下的芦刈町、牛津町、小城町、三日月町合并而成。因羊羹的消费量为全日本
  • 附件肿块附件肿块,是指子宫附件组织中生长肿物,通常位于卵巢和输卵管中。它可能是良性或恶性的。绝经期后妇女身体中的子宫附件疾病通常包括卵巢囊肿、子宫外孕、良性或恶性肿瘤、子宫