超参数 (机器学习)

✍ dations ◷ 2025-07-03 13:31:59 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 印度电影列表本列表为印度出品的电影资讯。
  • 砧板砧板,俗称切菜板或菜板,先秦又称俎,一种厨房用具,主要和刀具配合起来使用,用来切肉、鱼、蔬菜及水果等等。中国古代割肉所用的砧板称为俎,形如几案,多为木制,少有铜铸,长方形,两头有足
  • 多梅尼科·基尔兰达约多米尼哥·基兰达奥(Domenico Ghirlandaio 意大利语:;1449年-1494年1月11日),或译多梅尼科·基尔兰达约,是一位意大利文艺复兴时期的画家,也是佛罗伦萨在文艺复兴时期涌现的的第三代
  • 潘钟祥潘钟祥(1906年8月12日-1983年10月25日),字瑞生,生于河南汲县,病逝于北京。中国石油地质学家,中国石油地质学开创者之一。1931年毕业于北京大学地质学系,1941年在美国石油地质学家协
  • 恩佐·法拉利恩佐·安塞尔莫·朱塞佩·玛丽亚·法拉利(意大利语:Enzo Anselmo Giuseppe Maria Ferrari,1898年2月18日-1988年8月14日),意大利车手,企业家,法拉利汽车创始人。据恩佐·法拉利本人
  • 马耳他参议院马耳他参议院 (马耳他语:Senat),是一个曾经存在过的机构,他是1921年至1933年马耳他议院中的上院。《埃默里-米尔纳宪法》在1921年颁布,并创建一套两院系统,即拥有32席位的众议院
  • 一命《一命》(日语:いちめい,英语:),由三池崇史执导、市川海老藏 (十一代目)与瑛太双主演的日本古装电影,2011年上映。此片改编自泷口康彦(日语:滝口康彦)的原著小说《异闻浪人记》,是继196
  • 英波军事同盟英波军事同盟(Anglo-Polish military alliance)是大不列颠及北爱尔兰联合王国与波兰第二共和国间于1939年8月25日签署的条约,在该条约下英国承诺将协防波
  • 卡雅·巴尔罗之死卡雅·Bordevich·巴尔罗(Kaja Bordevich Ballo;1988年-2008年3月28日),是一位在法国尼斯念书的大学学生,他的父亲是挪威下议院议员奥拉夫·贡纳尔·巴尔罗(英语:Olav Gunnar Ballo)。2008年3月28日,卡雅在法国尼斯上学时,做了山达基教牛津能力分析测试。她的朋友和同寝室的室友声称,她的精神状态良好,没有迹象表明精神崩溃。但牛津能力分析报告结果却说:“她很沮丧,不负责任的,轻易批评和缺乏和谐。”几个小时后,她从宿舍阳台上跳楼自杀,她留下一份说明,告诉她
  • 本地垂迹说本地垂迹说(日语:本地垂迹/ほんじすいじゃく )是日本佛教兴盛时期的一种思想。日本神道的八百万神是佛菩萨的化身,称为权现。在理论上神佛具有同等地位。最早的佛教亦没有怀疑神的存在,但神仅仅为六道之一的天道,他们不及佛、菩萨,仍要轮回(天人五衰)。但在不同地方因受本地宗教抵抗,佛教僧侣为了解决此问题提出本地垂迹,故意把当地神明改称为佛、菩萨的化身,给予两者平等地位。日本之论者又称为神佛习合。最早提出本地垂迹说的是僧肇,但在日本发展最完备与浑然一体。在日本国神称本地佛。垂迹神与本地佛如下: