超参数 (机器学习)

✍ dations ◷ 2025-12-02 04:56:49 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 多奈哌齐多奈哌齐(Donepezil),商品名为安理申(Aricept)等,是一种用于治疗阿尔茨海默病的药物。它似乎能有限地改善心理机能和功能。然而,尚未证实服药可改变病程。如果病情没有任何改善,应停
  • 灰泥灰泥(plaster),又称巴黎灰泥、熟石膏,是一种基于硫酸钙的建筑材料,化学式为 CaSO4·0.5H2O 。其制法是将石膏加水混合后再加热至150 °C。灰泥是欧洲的大教堂建筑内墙壁及天花
  • 州审计长加利福尼亚州审计长 (California State Controller) 是美国加利福尼亚州政府的首席财务官,并为加州公平委员会的当然成员。其权限与责任比加州财政部长稍大。其责任为调查州
  • 贝尔法斯特都市区贝尔法斯特都市区(英语:Belfast Metropolitan Area)是位于英国北爱尔兰的一个都市区,包括了贝尔法斯特及其邻近的卫星城市。贝尔法斯特都市区共有人口579,276人。贝尔法斯特都市
  • 赛尔号大电影5:雷神崛起罗玉婷翟巍王晓彤孙晔吴磊蒋可刘北辰上海淘米光线传媒爱奇艺《赛尔号大电影5:雷神崛起》(英语:Seer 5: Rise of Thunder)是由上海淘米网络科技有限公司运营的的儿童虚拟社区《赛
  • 练业坤练业坤(1827年-1863年),广西人,1862年战功封赠“梯王”,为“侍王”李世贤辖之大将,1860年攻安征征州(今歙县),占浙江严州(今梅城),封轮天义。1861年三月又随李世贤自婺源入江西,四月攻克景
  • 女性主义理论女性主义理论(英语:Feminist theory)是女性主义在理论与哲学范畴的延伸。它旨在理解性别不平等的本质。它在多个学术领域观察女性的社会角色、经验、利益和政治参与,比如人类学
  • 钉子花《钉子花》(英语:),是伍佰&China Blue的第三张全台语创作专辑,自2005年1月7日《双面人》睽违近十二年来再度推出全台语专辑,专辑预购日为2016年12月13日,并于12月28日正式发行。此
  • 卡尔二世 (黑森-菲利普斯塔尔)卡尔二世(德语:Karl II. von Hessen-Philippsthal;1803年5月22日-1868年2月12日),末代黑森-菲利普斯塔尔(德语:Hessen-Philippsthal)伯爵,1849年至1866年在位。1866年,由于黑森在普奥战争中加入奥地利阵营,战后黑森-菲利普斯塔尔和黑森选侯国一同被普鲁士并吞。1845年,卡尔和符腾堡的玛丽(德语:Marie von Württemberg (1818–1888))结婚,两人共有两个儿子:
  • 桥本大辉桥本大辉(日语:橋本 大輝/はしもと だいき ,2001年8月7日-),日本男子竞技体操运动员。千叶县成田市出身。2021年,他在2020年夏季奥林匹克运动会体操比赛代表日本和队友夺得男子团体银牌,以及在男子个人全能比赛中,获得金牌。8月3日,桥本大辉在竞技体操男子单杠比赛中获得冠军,夺得东京奥运会上的个人第二枚金牌。2021年7月28日,东京奥运会举行的体操比赛中,桥本大辉在男子个人全能项目决赛以0.4分的些微优势成功击败中国选手肖若腾拿下金牌,因其在跳马环节落地时出现出界失误,该项目获得14.7分,总