超参数 (机器学习)

✍ dations ◷ 2025-11-19 12:29:05 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 非特异性症状人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学症状(英语:symptom)又称病状,医学术语,在疾
  • 舍宁根舍宁根(德语:Schöningen)是德国下萨克森州的一个市镇。总面积35.36平方公里,总人口11847人,其中男性5836人,女性6011人(2011年12月31日),人口密度335人/平方公里。
  • 越绝书《越绝书》,又称《越绝》、《越绝记》,成书大约在东汉,记录了春秋末期越王勾践兴越灭吴的相关历史,是中国最古老的方域史,也是记载越国历史的文献中内容最为丰富的权威著作。《越
  • 台湾鹎台湾鹎 (学名:),又名台湾鹎,为台湾特有种,只分布在当地东部和南部。虽然在某些地区相当普遍,此鸟种仍被列为易危,因栖地的破坏和同属鸟种白头鹎杂交造成数量减少,此两鸟种分布在某些
  • 拉苏尔·伽姆扎托夫拉苏尔·伽姆扎托夫(阿瓦尔语:Расул ХIамзатов,1923年9月8日-2003年11月3日),俄罗斯阿瓦尔族诗人,他以阿瓦尔语创作。伽姆扎托夫出生于达吉斯坦偏僻的山村查达,父亲伽
  • 平将门平将门(大约903年-940年3月25日),日本桓武天皇的五世孙,于朱雀天皇天庆二年(939年),在下总国举兵谋反,自称新皇。2月13日,在幸嶋郡北山一战时身中藤原秀乡的镝矢而战死,其后遭到斩首。
  • 沈定庵沈定庵(1927年-),男,浙江绍兴人,中国书法家、画家、篆刻家,曾任中国书法家协会理事,浙江省书法家协会副主席。
  • 神谷英树神谷英树(1970年12月19日-)是游戏设计师。长野县松本市出生。游戏代表作为《生化危机2》、《鬼泣》、《红侠乔依》、《大神》、还有《猎天使魔女》等等。在1994年时进入卡普空
  • 史帝芬宇宙人物表史帝芬宇宙人物表是收录美国电视系列动画史帝芬宇宙(英语:)中登场次数多数人物之列表。(本条目中人物以英文原名和中文直接音译为主,台湾翻译版本以括号附注)此外还有一些宝石人的阶级于剧情中尚未明朗化,如红绿柱石(Bixbites)、锂辉石(Spodumenes)、碧玺(Tourmalines)、金红石(Rutiles)、绿柱石(Beryls)、蛇纹石(Serpentines)、黄铁矿(Pyrites)、小梳(Comby)、沙漠玻璃(Desert Glasses)、硅孔雀石(Chrysocollas)、纳长石(
  • 威尔森·帕拉西奥斯威尔森·帕拉西奥斯(西班牙语:Wilson Palacios,1984年7月29日-),是洪都拉斯足球运动员,司职中场,曾效力于英超俱乐部维冈竞技、热刺和斯托克城。帕拉西奥斯和他的四名兄弟(美顿、谢利、尊尼及艾荣)一起在维多利亚体育俱乐部(Club Deportivo Victoria)展开其足球生涯,其后五人一同转会奥林匹亚体育俱乐部(Club Deportivo Olimpia)。他在2006年对马拉松体育俱乐部(Club Deportivo Marathón)时,在比赛末段从中场线射入一个惊人的进球