超参数 (机器学习)

✍ dations ◷ 2025-11-26 02:55:39 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 博茨瓦纳面积以下资讯是以2014年估计家用电源国家领袖国内生产总值(购买力平价) 以下资讯是以2016年估计国内生产总值(国际汇率) 以下资讯是以2016年估计人类发展指数 以下资讯是以2018
  • 北干巴鲁北干巴鲁(印尼语:Kota Pekanbaru,或称北矸,北干峇鲁,佩坎巴鲁等)为印尼廖内省的首府,同时也是苏门答腊岛内第五大城市。“北干巴鲁”在印度尼西亚语中的意思是“新城镇”,是濒临马六
  • 池可能指:
  • 亚历山德罗·斯特拉代拉亚历山德罗·斯特拉代拉(意大利语:Alessandro Stradella,1639年4月3日-1682年2月25日),意大利作曲家。早年曾被瑞典皇后聘用为歌手,1678年移居热那亚,1682年被谋杀。作品主要为康塔
  • 矶野宏夫矶野 宏夫(いその ひろお,1945年-2013年5月28日)是日本的画家、插画家。爱知县出身。爱知教育大学教育学部美术科毕业。
  • 盔蟹科见内文盔蟹科()是短尾下目(螃蟹)以下的一个科,原属黄道蟹总科,现时独立出来成为盔蟹总科()。它包含有最古老的蟹派化石品种,可追溯远至侏罗纪中期的巴通阶。盔蟹科含有8个属,包括10个
  • 你的孩子不是你的孩子《你的孩子不是你的孩子》,是一部2018年的台湾诗选电视剧,改编自作家吴晓乐的同名作品里的五个故事,分别为《妈妈的遥控器》、《猫的孩子》、《茉莉的最后一天》、《孔雀》、《
  • 埃维尔·布莱克威尔埃维尔·布莱克威尔(英语:Ewell Blackwell,1922年10月23日-1996年10月29日),绰号“鞭子”,为美国职棒大联盟的投手。生涯曾效力过红人、洋基与运动家等队。布莱克威尔身高188公分,体重88公斤。在当时算是联盟的强投之一,他曾连续6年入选明星赛,并在1950年明星赛拿下胜投。1947年6月18日,布莱克威尔面对勇士队投出无安打比赛。6月22日,他在下一场先发投出8局无安打比赛,不过最后在9局破功,无缘成为史上第二位连续2场比赛投出无安打比赛的投手。1947年是布莱克威尔的生涯年,
  • 雷州文化雷州文化是指雷州半岛雷州闽族人所创造的的文化,包括方言、戏剧音乐、舞蹈、工艺、民俗、建筑、人文、饮食等方面。如雷州话、雷剧……等。雷州由于历史的渊源地缘关系,成为历史上莆仙文化、百越文化、海洋贸易文化和中原文化的交汇地,进而逐渐形成独特的雷州文化。
  • 川本纱矢川本纱矢(日语:川本 紗矢,1998年8月31日-)是日本女艺人,为女子偶像团体AKB48 Team 4前成员,北海道别海町出身,所属经纪公司为Incubation。