超参数 (机器学习)

✍ dations ◷ 2025-11-28 20:33:24 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 胞外酶周质空间(periplasmic space),又称为周质(periplasm)或壁膜间隙,是革兰氏阴性菌的细胞膜与外膜(Outer membrane)之间的间隔区域。在革兰氏阴性菌中,一般指其外膜与细胞膜之间的狭窄空
  • 仙游话仙游话(兴化平话字:Hsing-iú-uā)是莆仙语(兴化语)的一种方言,通行于莆田的仙游县一带。仙游话一般以城关话为代表,其使用者以仙游县为中心,福州的永泰县,泉州的泉港区以及惠安北部
  • Pocock雷金纳德·英尼斯·波科克F.R.S.(Reginald Innes Pocock,1863年8月4日-1947年8月9日) 是一位英国动物学家。波科克出生于布里斯托的克里夫顿,是Rev. Nicholas Pocock 和 Edith P
  • 州 (俄罗斯)州(俄语:Область),是俄罗斯联邦一种联邦主体类型。到目前为止俄罗斯联邦的85个联邦主体中有46个属于州。按图上编号做列表:按照旗帜做列表:
  • 电子序列号电子序列号(英语:Electronic Serial Number,缩写:ESN),又称ESN码是美国联邦通信委员会规定的,每一台移动设备(例如移动电话、智能手机、平板电脑等)独有的参数,其长度为32位。早在1980
  • 电子点火头电子点火头,又名电子点火器、电子点火棒、电火柴,是一种用外部施加的电流点燃可燃性化合物的设备。电子点火头使用由加热元件组成的桥丝来点燃热原体,热原体是大量易燃的烟火起
  • 神经肽神经肽(英文:neuropeptide)是由神经元产生的小蛋白,作用于G蛋白偶联受体,负责突触传递的缓慢发作,持久调节。神经肽通常在单个神经元中彼此或
  • 撒奇莱雅语语法撒奇莱雅语语法(Grammal na Sakizaya、Sakizaya grammar)为基于撒奇莱雅语之"语法"(waway na sikawman、glammal)。在语法的分类上台湾南岛语言并不同于一般的分析语或其它综合语里的动词、名词、形容词、介词和副词等之基本词类分类。比如台湾南岛语里普遍没有副词,而副词的概念一般以动词方式呈现、可称之为“副动词”,类之于俄语里的副动词。 对于数、格(附着)及时态改变时语词的变化。撒奇莱雅语只有代词本身会依格位之不同而进行变格运作。谓语本身不会依人称、数、性之
  • 太原承宣太原承宣(越南语:Thừa Tuyên Thái Nguyên/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","TH-Khaai-TP0","TH-Khaai-TP2","TH-Khaai-PP0","TH-Khaai-PP2","TH-Sung-PP0","TH-Sung-PP2","TH-Sung-TP0","TH-Sung-TP2
  • 小珠光小珠光(日语:小珠 ひかる,1999年7月4日-),日本女性配音员。出身于埼玉县。DEARSTAGE(日语:ディアステージ (企業))所属。旧艺名“小出ひかる”。身高152cm。B型血。2014年获得由株式会社EARTH STAR Entertainment在2014年举办的《国民声优大赏》审查员特别奖之后,作为声优组合Earth Star Dream的成员活动。另外2017年1月与也是Earth Star Dream的成员高尾奏音2人组成“ひかのん”。至于她个人的形象颜色是黄色。2018年3月31日,随