超参数 (机器学习)

✍ dations ◷ 2025-11-07 08:53:45 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 福冈大学福冈大学福冈大学(日语:ふくおかだいがく,英语:The University of Fukuoka / Fukuoka University)是一所位于日本福冈县福冈市的私立大学。
  • 脑下垂体柄脑垂腺柄(pituitary stalk、infundibular stalk、Fenderson's funnel、infundibulum)是下丘脑和脑垂腺后叶(英语:Posterior pituitary)之间的连接部分。第三脑室(英语:Third ventri
  • 丹麦体育丹麦体育十分多样化。丹麦的国家运动是足球,最大的成就是连续六届入围欧洲国家杯,并于1992年获得冠军。其他显著的战绩包括赢得1995年国际足联洲际国家杯,以及1998年世界杯打进
  • 熊泽英昭熊泽英昭(日语:熊澤 英昭/くまざわ ひであき ,1943年-),是日本农林水产省前事务次官。曾任日本驻捷克大使。熊泽英昭长子熊泽英一郎生于1975年,成年后长期失业在家,沉溺于网络游戏,曾
  • 吴甲豆吴甲豆(越南语:Ngô Giáp Đậu/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H","
  • 月光 (单曲)月光(げっこう)为日本创作型歌手鬼束千寻于2000年8月9日所发行的第二张原创单曲。
  • 巴勒斯坦犹太人巴勒斯坦犹太人(英语:Palestinian Jews),世居在巴勒斯坦托管地的犹太人,在1948年以色列建国之前,他们就居住在此地,犹太社群当时被称为依舒夫(Yishuv,意为居民、城镇)。在他们之中,又区
  • 第四次威尼斯土耳其战争 神圣同盟:第四次威尼斯土耳其战争,又称塞浦路斯战役(意大利语:Guerra di Cipro),是一场发生于1570年~1573年间的一场战役,为奥斯曼土耳其帝国与威尼斯共和国之间的第四场战役。其中,后者加入了神圣同盟——一个由教皇之主持下,形成的基督教国家之军事联盟,西班牙帝国(包括拿坡里王国与西西里王国)、热内亚共和国、萨伏依公国、医院骑士团、托斯卡纳大公国及其余意大利诸国皆在此联盟之内。这场战争是奥斯曼苏丹塞利姆二世统治期间的其中一项大捷,始于奥斯曼帝国入侵由威尼斯人所控制的塞浦路斯岛(英语:Ve
  • 藤田麻美藤田 麻美(1989年4月22日-)是日本的女性声优。曾是I'm Enterprise所属。东京都出身。血型是A型。日本Narration演技研究所第21期生,通过“免费新人育成考试”成为特待生。2013年11月30日退出I'm Enterprise,以追求自身的成长,并希望在演艺和音乐上进一步学习,想要增进表现力及开拓其它可能性。兴趣是观赏舞台剧、绘画、唱歌、篮球、网球。特长是弹钢琴。※粗体字为主要角色2008年2009年2010年2011年2012年2013年2016年2017年2018年2019年2
  • 兵笠兵笠,又名战笠,是明代汉族及朝鲜族传统士兵帽饰。本是朝鲜王朝时期下级两班所著,主要集中在今韩半岛西北部地区。直至万历朝鲜战争和1636年丙子胡乱过后,更被传播至朝鲜全国。这种帽也是明代士兵的帽,原型是宋元时期的军帽。但在剃发易服后在中国被禁只保留在朝鲜。战笠上有不同羽毛与饰巾分别等级。