超参数 (机器学习)

✍ dations ◷ 2025-12-03 10:40:54 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 克拉伦斯·沃尔顿·李拉海克拉伦斯·沃尔顿·“沃尔特”·李拉海(英语:Clarence Walton "Walt" Lillehei,1918年10月23日-1999年7月5日),美国外科医生,心内直视手术的先驱开创者之一,被称作“心内直视手术之
  • 扁枝衣扁枝衣(学名:Evernia mesomorpha)是一种可以形成枝状地衣的真菌,属于子囊菌门茶渍纲茶渍目梅衣科扁枝衣属,与共球藻属(英语:Trebouxia)的绿藻形成地衣。本种与共球藻属(英语:Trebouxia
  • 疥癣疥疮(Scabies),是由疥螨(英语:Sarcoptes scabiei)在人体皮肤表皮层内引起的接触性传染性皮肤病。最常见的症状为严重搔痒和泛红丘疹。偶见患者皮肤上会有疥螨移行的痕迹(英语:burrow
  • 比利时法语社群法语社群(Communauté française),又称瓦隆-布鲁塞尔联盟(Fédération Wallonie-Bruxelles),是比利时三个社群之一。法语社群的意思是使用法语的比利时人;并成立代表比利时法语居
  • 2011年泰国羽毛球黄金大奖赛2011年泰国羽毛球黄金大奖赛为第24届泰国羽毛球公开赛,是2011年世界羽联大奖赛的其中一站。本届赛事于2011年6月7日-6月12日在泰国的首都曼谷的CU Sport Complex举行,并获得暹
  • 宫良长详宫良长详(1894年1月11日-1965年1月30日),出生于日本冲绳县石垣市,琉球姓氏为山阳姓。二次大战前为日本冲绳县的医生,战后成为日本冲绳县八重山群岛地区的政治家,曾担任八重山自治会
  • 阮志咏阮志咏(越南语:Nguyễn Chí Vịnh,1957年5月15日-)现任越南共产党第十二届中央委员会、越南共产党中央军事委员会常委、越南国防部副部长,上将军衔,分管军事情报与军事外交。阮志
  • 十川站 (高知县)十川站(日语:十川駅/とおかわえき  */?)是一位于日本高知县高冈郡四万十町十川、隶属于四国旅客铁道(JR四国)的铁路车站。车站编号为G32。附近有较多民居,因此每天的平均客量算是
  • 皮埃尔·德佩皮埃尔·德佩(法语:Pierre Jean Capretz,1925年1月30日-2014年4月1日)是一名教育家和作家、法语教师。他毕业于巴黎大学,后再1949年,任教于佛罗里达大学,1956年,加入耶鲁大学,担任语言
  • 漫威英雄 Online《漫威英雄 Online》(英语:Marvel Heroes Online)是一款以漫威漫画世界为背景的大型多人在线角色扮演游戏。,玩家在游戏中扮演漫威世界的超级英雄,对付九头蛇等反派以拯救世界。