表征学习

✍ dations ◷ 2025-06-07 01:56:17 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。 有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。

相关

  • 惊恐发作恐慌发作(Panic attack)的意义为患者在强烈恐惧下,表现出一系列的身心症状。(常见换气过度或气喘)当恐慌发作,患者会感受到强烈不适,因此常求助于急诊室。一个人在一生中可能出现极
  • 羊肚菌羊肚菌属(学名:Morchella、英语:morels),是子囊菌门羊肚菌科的一个属,形态特征为子囊果的外表呈蜂窝状。本属最早于1794年由克里斯蒂安·亨德里克·珀森描述发表,模式种为美味羊肚
  • 罗伯特·温伯格罗伯特·阿伦·温伯格(英语:Robert Allan Weinberg,1942年11月11日-),美国癌症学家。1969年,取得麻省理工学院博士学位。他是麻省理工学院的丹尼尔·K·路德维希癌症研究教授(Daniel
  • 民间音乐民间音乐,又称民俗音乐、民间歌谣,简称民歌、民谣、民乐,于国际民间音乐协会之解释定义为“经过口传过程发展起来的普罗大众音乐”,也就是该音乐散布过程,纯粹是由演奏者或音乐接
  • 朔望月朔望月,在天体测量学中,是指月球连续两次合朔的时间间隔。因为摄动的关系,朔望月的长度大约在29.27至29.83天之间变动著,长期的平均长度是29.530588天(29天12小时44分2.8秒),或大约
  • 东西伯利亚海东西伯利亚海(俄语:Восто́чно-Сиби́рское мо́ре)是北冰洋内的一个边缘海,位于北面的北极角(Arctic Cape)和南面的西伯利亚之间。东面隔弗兰格尔岛和楚克
  • 锺正明锺正明(1952年-),出生于台湾的美籍华人细胞生物学家,中央研究院院士,现任教于美国南加州大学病理系。锺正明双亲皆受过高等教育,其父亲锺有成是台湾日本统治时期的台北帝国大学医学
  • 赵进才赵进才(1960年12月-),内蒙古丰镇人,中国环境化学家,中国科学院化学研究所研究员。1982年7月毕业于内蒙古大学化学系,1986年8月获该校硕士学位,1994年4月获日本Meisei大学博士学位。2
  • 诺克斯学院诺克斯学院是多伦多大学的一所研究生神学院,它是1843年苏格兰教会的分裂运动的产物。于1844年建立的诺克斯学院隶属于加拿大长老教会,现今以多伦多神学院的成员学院的身份提供
  • 纵火狂纵火狂是一种有关控制冲动的障碍,其中患者反复无法抵抗故意纵火,以缓解紧张或获得满足。纵火狂不等同于纵火行为,纵火狂并不是为了经济或政治利益,而且对与火有相联的物件,例如消