首页 >
表征学习
✍ dations ◷ 2025-12-10 14:35:10 #表征学习
在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。机器学习任务,例如分类问题,通常都要求输入在数学上或者在计算上都非常便于处理,在这样的前提下,特征学习就应运而生了。然而,在我们现实世界中的数据例如图片,视频,以及传感器的测量值都非常的复杂,冗余并且多变。那么,如何有效的提取出特征并且将其表达出来就显得非常重要。传统的手动提取特征需要大量的人力并且依赖于非常专业的知识。同时,还不便于推广。这就要求特征学习技术的整体设计非常有效,自动化,并且易于推广。特征学习可以被分为两类:监督的和无监督的,类似于机器学习。监督特征学习就是从被标记的数据中学习特征。大致有一下几种方法。总体来说,字典学习是为了从输入数据获得一组的表征元素,使每一个数据点可以(近似的)通过对表征元素加权求和来重构。字典中的元素和权值可以通过最小化表征误差来得到。通过L1正则化可以让权值变得稀疏(例,每一个数据点的表征只有几个非零的权值)。监督字典学习利用输入数据的结构和给定的标签(输出)来优化字典。例如,2009年Mairal等人提出的一种监督字典学习方案被应用在了分类问题上。这个方案的优化目标包括最小化分类误差,表征误差,权值的1范数(L1正则化)和分类器参数的2范数。
有监督的字典学习可以被视为一个三层神经网络(一层隐含层),第一层(输入层)到第二层(隐含层)是表征学习,第二层到第三层(输出)是分类器的参数回归。神经网络是通过多层由内部相连的节点组成的网络的一个学习算法。它的命名是受到神经系统的启发,它的每一个节点就像神经系统里的神经元,而每一条边就像一条突触。神经网络里面的每一条边都有对应的权值,而整个网络则定义运算法则将输入数据转换成为输出。神经网络的网络函数通过权值来刻画输入层跟输出层之间的关系。通过适当的调整网络函数,可以尽量最小化损耗的同时解决各种各样的机器学习任务。
相关
- 黄体素孕酮(英语:progesterone,亦被称为黄体酮、孕甾酮、黄体甾酮、助孕激素、助孕素、黄体素或助孕酮,其缩写为P4,也被称为(孕甾-4-烯-3,20-二酮),是一种内源性类固醇和孕激素性激素,也
- 腹股沟肉芽肿腹股沟肉芽肿(学名:Granuloma inguinale,亦作donovanosis)是一种由致病细菌克雷伯氏菌属的肉芽肿克雷伯氏菌(英语:Klebsiella granulomatis)(Klebsiella granulomatis(英语:Klebsiella
- 大西洋大西洋(西班牙语:Océano Atlántico,葡萄牙语:Oceano Atlântico,英语:Atlantic Ocean),是世界第二大洋。原面积8221万7千平方公里,在南冰洋确立后,面积调整为7676万2千平方公里。平
- 遗传性出血性血管扩张症遗传性出血性血管扩张症是一种遗传病,其会导致各种黏膜、内脏血管病变,由此导致各种出血。大部分患者会出现鼻、脑、肺及胃、肠出血。此遗传病10万分之1,主要发生于白人。遗传
- 银杏门银杏是一类种子植物,最早出现在晚古生代早二叠世,在侏罗纪和早白垩世最为繁盛,此后逐渐衰落。现在,银杏(Ginkgo biloba)是银杏类植物的唯一成员。银杏类植物为高大多枝落叶乔木、
- 乔治·C·威廉斯乔治·克里斯托弗·威廉斯(英语:George Christopher Williams,1926年5月12日-2010年9月8日)是美国演化生物学家。
- Journal of Chemical Physics化学物理学报(Journal of Chemical Physics)是一份科学学术期刊,发表化学物理各领域的论文,由美国物理协会出版,每年出版两卷,各24期。
- 斯克里文县斯克里文县(Screven County)是美国佐治亚州东部的一个县,东邻南卡罗来纳州。面积1,698平方公里。根据美国2000年人口普查,共有人口15,374人。县治西尔瓦尼亚。成立于1793年12月1
- 异硫氰酸酯异硫氰酸酯(Isothiocyanate)是一类通式为R-N=C=S的有机化合物,可看作是由异氰酸酯中的氧原子被硫替换后形成。异硫氰酸盐是硫氰酸根(SCN−)用氮原子配位时生成的化合物(M-N=C=S)。
- 花样结构模体(英语:structural motif,亦称为结构基序)是链状生物分子(如蛋白质或核酸)中的一种超二级结构,也存在于其它分子之中。结构模体使得我们无法预测蛋白的生物学功能:不同蛋白质
