超参数 (机器学习)

✍ dations ◷ 2025-12-05 07:35:46 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 路德维希·维特根斯坦路德维希‧约瑟夫‧约翰‧维特根斯坦(德语:Ludwig Josef Johann Wittgenstein,又译维特根施泰因、维特根斯坦;1889年4月26日-1951年4月29日)是一名奥地利哲学家。他生于奥地利,后入
  • 申师任堂申师任堂(朝鲜语:신사임당,1504年10月29日-1551年5月17日),朝鲜国中期的女性书画家、作家、儒学者和诗人。儒学者李栗谷的母亲。字仁善、号师任堂、思任堂、师妊堂、妊师斋、任堂
  • 深圳体育场深圳体育场,座落于深圳市福田区笔架山下,东邻上步北路,北接泥岗西路,南靠笋岗路,落成于1993年6月,总面积达到24892平方米,总投资1.41亿元人民币,场地包含一个主体育场及1个副场。设
  • 九龙山 (北京)九龙山位于北京朝阳区,广渠路与西大望路交叉点。九龙山地铁站是北京地铁7号线和 █ 14号线的换乘站。途径北京九龙山公交站的有11路、30路、382路等14条公交线路。北京九龙山
  • 刘涓子鬼遗方《刘涓子鬼遗方》由晋朝刘涓子撰,南齐龚庆宣整理。成书于483年,该书是中国现存最早的外科学专著。全书5卷,总论外科痈与疽的鉴别,卷2-5论述金疮外伤治法、杂病,并载列外科常用方剂
  • 盗墓笔记 (2016年电影)《盗墓笔记》(英文:Time Raiders),是根据南派三叔同名网络小说改编。讲述了醉心于古建筑的吴邪因偶然的机会在三叔吴三省带领下,与张起灵、阿宁、潘子、王胖子,开始了一场前所未有
  • 汉口乐善堂汉口乐善堂(日语:かんこうらくぜんどう)日本明治时期,荒尾精在岸田吟香和伊集院五郎的资助下于1884年在中国汉口成立的乐善堂分店,主要经营眼药水、书籍、杂货,也是荒尾精在中国大
  • 庇护集团庇护集团(patron-client groups)一词指政治理论中庇护人之间结成的同盟。通常庇护人是本地的强力人物,拥有财力与与政治势力;他对他人施予恩惠,包括工作机会、贷款、住房、帮助建立工商业,为工商业提供保护,为大学入学者提供援助,诸如此类;作为对社区中其他人对他表示政治忠诚的回报,并成为其他人收益的组成部分。地方庇护人继而成为国家领袖和国家性政党的庇护者,接受他们施与的恩惠。
  • 独家报导:良辰杀人记《独家报导:良辰杀人记》(韩语:특종: 량첸살인기,)是一部2015年上映的韩国犯罪悬疑片,由《恋爱的温度》导演卢德(朝鲜语:노덕)执导,曹政奭、李美淑、李荷娜主演。该片讲述记者许武赫得知自己一辈子只有一次的连环杀人案相关的独家报导是史无前例的失误后,在无法挽回的情况下,正如他所误报的那样,案件真实地发生了并渐渐变得严重的故事,2015年10月22日在韩国上映。
  • 布鲁鹃鵙布鲁鹃鵙(学名:)是山椒鸟科鸦鹃鵙属的一种。为印度尼西亚的特有种。其自然栖息地为亚热带或热带的湿润低地森林以及亚热带或热带的湿润山地。该物种受栖息地破坏的威胁。