超参数 (机器学习)

✍ dations ◷ 2025-12-02 10:55:54 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 苹果电脑苹果公司(英语:Apple Inc.,NASDAQ:AAPL),原称苹果电脑公司(英语:Apple Computer, Inc.),是总部位于美国加州库比蒂诺的跨国科技公司。最初由史蒂夫·乔布斯、史蒂夫·沃兹尼克、罗纳德
  • 曹文宣曹文宣(1934年5月19日-),四川彭州人,鱼类生物学家,中国科学院院士。曹文宣于1951年考入华西大学生物系。1952年院系调整后转入四川大学生物系,1955年毕业。此后前往武汉中国科学院
  • 琼雷语琼雷话是语言学中对闽语里面的海南话(琼文话)与雷州话的合称。海南话与雷州话均脱胎自古代闽南语。宋代末期,由于战乱,大量闽南人离开故乡,迁徙到雷州半岛和海南岛沿海一带。他们
  • 瓦桑加利瓦桑加利苏丹国(索马里语:Saldanadda Warsangeli、阿拉伯语:سلطنة الورسنجلي‎)是索马里人建立统治索马里东北部和东南部的帝国。在其鼎盛时期,包括萨纳格州和索马
  • 李凖李准可以指:
  • 乔治·费舍·贝克乔治·费舍·贝克 (英语:George Fisher Baker;1840年3月27日 - 1931年5月2日),美国著名金融家、银行家和慈善家,被誉为“美国银行业的祖师爷”(Dean of American Banking)。在公众场
  • 雪姓雪姓是一个罕见的姓氏。它的来源不详,总人口亦不详,但现时的雪姓族群大都是回族人,也有不少汉族人。大多数聚居于华北,包括有北京市、呼和浩特及山东省的平度市,以及甘肃省庆阳市
  • 比尔·弗里罕威廉·艾许利·弗里罕(英语:William Ashley Freehan,1941年11月29日-2021年8月19日),为美国职棒大联盟的捕手。职业生涯皆效力于底特律老虎。他生涯入选11次明星赛,并在1968年拿下世界大赛冠军与MVP第二名。弗里罕生涯拿过5座金手套奖,守备率高达9成93。另外他职业生涯敲出200轰与2502个垒打数,在美联捕手历史上排名第三,仅次于两位洋基传奇名捕尤吉·贝拉和比尔·狄奇。弗里罕就读于密歇根大学。1961年,还是大学生的他曾缴出5成85的打击率。这使得老虎队看上了他的天赋
  • 昂夫勒维尔苏莱蒙昂夫勒维尔苏莱蒙(法语:Amfreville-sous-les-Monts,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium Alternative","TITUS Cyberbit Basic","Arial Unicode MS","IPAPANNEW","Ch
  • 美貌的神话《美貌的神话》(英语:The Beauty Myth)是一本由美国作家、知名女性主义者内奥米·沃尔夫(英语:Naomi Wolf)编著、在1991年出版的书籍。正如本书副标题“美丽的形象如何被用来对抗女性”(英语:)所言,沃尔夫深入探究了社会对于女性美貌的现代观感和理解,如何对就业、文化、宗教、整容,甚至性行为、进食障碍等方面造成巨大影响。其中一个重要的观点,就是由男性主导的时装与化妆品工业规定了女性的打扮方式,迫使她们为一种不可能做到的男性想象中的完美而想方设法。