超参数 (机器学习)

✍ dations ◷ 2025-12-07 23:52:52 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 免疫治疗免疫治疗(英语:Immunotherapy),是指通过诱导、增强或抑制免疫反应的疾病治疗方法。其中旨在引起或增强免疫反应的免疫疗法,称为激活免疫疗法(activation immunotherapies),而减少或
  • 外曾祖父曾祖父母(英语:Great grandparents)是祖父的父亲母亲;又称爷爷的父亲母亲。自己则分别是曾祖父母的曾孙子或曾孙女。在北方地区习惯称呼曾祖父称为“太爷爷”,曾祖母为“太奶奶”
  • 伊林 (物理学家)伊林(1951年4月19日-),台湾物理学家,中央研究院院士,现任教于国立中央大学物理系。是研究等离子的专家。伊林生于1951年4月19日,其名字是取自父母的姓氏,父母都是教师。1973年毕业于
  • 冬赛馆事件冬赛馆事件或冬赛馆抓捕(法语:Rafle du Vélodrome d'Hiver)是1942年7月16日至17日在法国巴黎,由纳粹德国指挥法国警察执行的针对犹太人的大规模抓捕行动,代号“春风行动”(法语:Op
  • Solo (单曲) 除特别注明外,本文所有时间均以东九区时间(UTC+9)为准。《Solo》(风格化为SOLO)是韩国女子音乐组合BLACKPINK的成员Jennie的个人出道单曲,单曲由Genie音乐和新视镜唱片发行于201
  • 新式俄勒冈制新式俄勒冈制是一种辩论赛制。此赛制的优点是过程紧密,能够对许多议题做出检证。缺点是在没有学过辩论的人眼中,对于其他赛制而言较为无趣。因此,本赛制十分适合采用政策性辩题
  • 来吃晚饭的人《来吃晚饭的人》(英语:The Man Who Came to Dinner)是一部1942年的美国电影,由William Keighley执导,Bette Davis、Ann Sheridan、Monty Woolley主演。
  • 景善景善(1823年-1900年),字子慕,号茀亭,绥芬马佳氏,满洲正白旗人,清朝政治人物。被认为是《景善日记》作者,但学术界对此有争论,一部分则人认为是“北京隐士”巴豪斯(又译“白克浩司”)伪造
  • 伟恩·第伯伟恩·第伯(Wayne Thiebaud,1920年11月23日-2021年12月25日)是一位出生在美国亚利桑那州梅莎市(Mesa)的普普艺术画家,曾在纽约、好莱坞做过卡通画家和广告设计师多达十年以上。他的名字有时简称为“第波”。他的作品最出名的是1961年的“派、派、派”(Pies, Pies, Pies)和1963年的“蛋糕”(Cakes)。1942年到1946年间,他曾加入美国空军服务。1951年,他从沙加缅度州立学院(Sacramento State College)毕业,并开始在该校艺术系任职
  • 孕妇摄影孕妇摄影,亦作怀孕摄影,是一门新兴的人像摄影艺术,主要有两个目的,一是透过摄影手法表达出孕妇的美感;再者透过连续的摄影来表达孕妇在怀孕期的身体变化,从而彰显生命的奥妙和美丽。孕妇摄影在过往摄影器材未普及时,只有摄影发烧友才有机会体会。随着数码摄影器材的大幅降价、社交网络的普及,令到业余的孕妇摄影在各个社交网站涌现。为求得到更完美的效果,有些人亦愿意雇用专业摄影师来为孕妇拍照。一直以来,基于社会上各种有关孕妇照相的禁忌传说,孕妇摄影并不普遍。然而,自从美国女影星黛米·摩尔为《名利场》杂志()的于1991年8