超参数 (机器学习)

✍ dations ◷ 2025-03-07 10:53:45 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 高温合金高温合金又叫热强合金、超级合金(superalloy)。按基体组织材料可分为三类:铁基、镍基和钴基。按生产方式可分为铸造高温合金、变形高温合金和粉末高温合金。按强化机理可分为碳
  • 圣克拉拉省拉斯比利亚斯(Las Villas)省是古巴历史曾经存在的一个省份,省会为圣克拉拉市(非“圣克拉拉省”)(Santa Clara)。1978年时被一分为三,为现在的西恩富戈斯省、圣斯皮里图斯省和比亚克
  • 2019冠状病毒病西班牙疫情1月1月2月2月3月3月4月4月过去15日过去15日 2019冠状病毒病西班牙疫情是2019冠状病毒病在西班牙传染及爆发的具体情况。2020年1月31日,疫情首次蔓延至西班牙,当时一名德国游客
  • 登机牌登机牌是一种提供民用航空乘客登机证明的票证,通常是在乘客办理完登机报到手续后由航空公司发给。登机牌上,至少会标明乘客姓名、班机号码、搭机日期和时间。一般登机牌为长条
  • 官邸区官邸区(Konak)是土耳其伊兹密尔的一个区,在九个区中人口最多,并且在地理位置,行政,经济和历史上都占据中心位置。官邸区设立于1983 - 1984年,当时组建伊兹密尔大都市,其本身改为中区
  • 牧夫座Nu牧夫座ν是拜耳命名法的名称,它由牧夫座的两颗星分享,分别是:这两颗星在天球上相距0.17°。它们全都属于天市垣的星官七公(Qī Gōng),。托勒密认为牧夫座ν属于武仙座,而拜耳给了
  • 弗兰克·扎帕弗兰克·文森特·扎帕(Frank Vincent Zappa,1940年12月21日- 1993年12月4日),美国作曲家、创作歌手、电吉他手、唱片制作人、电影导演。在他超过30年的职业生涯中,他的音乐作品涵
  • 一个陌生女子的来信《一个陌生女子的来信》(),是奥地利犹太裔作家斯蒂芬·茨威格早期的短篇小说代表作。这篇小说在当年大受欢迎,1948年、1974年先后改编同名电影也引起轰动。史蒂芬·茨威格之后的
  • 陶源 (政治人物)陶源(1952年1月-),男,北京人,中华人民共和国政治人物,曾任宁夏回族自治区总工会主席,宁夏回族自治区政协副主席。
  • 柠檬特调《柠檬特调》(英语:Lemonade)是美国歌手碧昂丝的第六张录音室专辑,2016年4月23日由帕克伍德娱乐(英语:Parkwood Entertainment)与哥伦比亚唱片发行。这张专辑继2013年的同名专辑之后为第二张“视觉专辑”,这同时也是一个概念专辑。当它的前一张专辑每首单曲都有其个人音乐录影带,《柠檬特调》连同前张专辑在HBO播放了长达一小时的电影。其主要为一个节奏蓝调专辑,《柠檬特调》还环绕了一群的类型,其中包括流行,蓝调,摇滚,嘻哈,灵魂,放克,乡村,福音和陷阱乐。詹姆斯·布雷克,肯德里克