超参数 (机器学习)

✍ dations ◷ 2025-10-14 12:26:19 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 高育仁考试高育仁(1934年8月30日-),台湾台南人,曾任第四届台湾省议会议员、第七任台南县县长、第七、八届台湾省议会议长、立法委员,曾任中国电视公司董事长、三三会常务监事。高育仁的
  • ATCvet代码 (QI09)A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATCvet代码QI09(猪用免疫产品)是兽用解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WH
  • 主权民主俄罗斯联邦的民主区分于西方的“自由民主”,被称之为“主权民主”。它保留了国内主要的民主架构,但是给其增添了爱国主义、强国主义和民族主义的新内容。“主权民主”是一种政
  • 太平邢氏宗祠太平邢氏宗祠又名敦伦堂,位于中国浙江省绍兴嵊州市长乐镇太平村横街15号、西邻清风公祠,为太平邢氏总祠(属剡西邢氏),始建于明万历八年(1580),清乾隆五十年(1785)、嘉庆七年(1802)、道光
  • 天堂之主天堂之主(纽埃语:Ko e Iki he Lagi)是纽埃的国歌。Ko e Iki he Lagi Kua fakaalofa mai Ki Niue nei, ki Niue nei Kua pule totonu E Patuiki toatu Kua pule okooko ki Niue
  • 哥伦比亚火山列表所有坐标的地图 - OSM 所有坐标的地图 - Google 所有上至200个坐标的地图 - Bing哥伦比亚火山列表,列出哥伦比亚的活火山和死火山。
  • 2013年西班牙国王杯决赛2013年西班牙国王杯决赛是第110届西班牙国王杯的决赛,由皇家马德里和马德里竞技上演“马德里德比”,在2013年5月17日马德里伯纳乌球场争夺赛事冠军。此前两队曾于1960年、1961年、1975年和1992年在决赛对碰,当中皇家马德里仅在1975年摘下桂冠,其余皆由马德里竞技胜出。两队在法定时间内踢成1–1平手,最终马德里竞技凭米兰达在加时赛中的进球,2–1反胜皇家马德里,夺得球队1996年来首个国王杯冠军,也是队史上第10次夺魁。皇家马德里、马德里竞技及西班牙足协三方均同意决赛应在两支球队的所在城市
  • 2016年夏季奥林匹克运动会男子篮球比赛参赛球员名单2016年夏季奥林匹克运动会男子篮球参赛球员名单是2016年夏季奥林匹克运动会十二支男子篮球参赛代表队球员名单,只有被注册在名单内的球员才能参加本届赛事,各队可注册12名球员。On 27 July, Anderson Varejão left the squad due to injury and was replaced by Cristiano Felício.
  • 伊云奴·巴历伊云奴·巴历(克罗地亚语:Ivano Balić,1979年4月1日-),生于南斯拉夫斯普利特,克罗地亚男子手球运动员。巴历在国际大赛中屡获殊荣,曾连续6次当选大型锦标赛的最有价值球员;又曾两度当选“世界手球先生”(IHF World Player of the Year),并在国际手球联合会举行的评选中,获球迷选为“史上最优秀的男子手球选手”(The Best Male Handball Player Ever) 。巴历在参与手球运动前,曾是斯普利特POP 84 篮球俱乐部的职业篮球员;及后,他转到同市
  • 鲁斯兰与柳德米拉 (长诗)《鲁斯兰与柳德米拉》是俄国诗人亚历山大·谢尔盖耶维奇·普希金所著的第一篇奇幻童话故事,灵感来源于古俄罗斯时期的壮士歌。故事开篇的引言描绘了一个神秘的国度——卢科莫里,据说作者是从学识猫(俄罗斯神话中一只巨大食人猫,用自己有灵力的故事和歌声催眠走近的行人)那里偶然听到这个故事的。基辅大公把自己的女儿柳德米拉嫁给了勇士鲁斯兰,但是在新婚夜上,新娘被留着极长胡子的矮人巫师切尔诺莫尔抢走了。大公终止了婚礼并宣布拯救她的人将成为柳德米拉的丈夫。除鲁斯兰外还出现了三个竞争者:冷酷的拉格代、爱吹牛却胆小如鼠的法尔拉夫和