超参数 (机器学习)

✍ dations ◷ 2025-11-27 03:08:51 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 微系统微技术(英语:Micro-technology)包含了微机电感测和控制、驱动元件制程开发技术、微机电系统整合技术、射频(RF MEMS)、光学(Optical MEMS)、生物医学(Bio MEMS)、电脑与周边(Compute
  • 比利时独立比利时革命(法语:Révolution Belge,荷兰语:Belgische Revolutie / opstand / omwenteling)发生于1830年,比利时人受法国七月革命的鼓舞,反抗在1815年维也纳会议上强行合并荷兰及比
  • 萨巴捷保罗·萨巴捷(法语:Paul Sabatier,1854年11月5日-1941年8月14日),法国化学家,出生于法国卡尔卡松,逝于图卢兹。在1912年,他与维克多·格林尼亚共同获得诺贝尔化学奖。1874年,萨巴捷进
  • 灰海豹属灰海豹(学名:Halichoerus grypus)是海豹科中其中一个主要物种,主要分布于北大西洋一带的海岸。它们是海豹科中的一种大型海豹,亦是灰海豹属(Halichoerus)中的唯一成员。它们亦有另
  • 新爱尔兰新爱尔兰岛(New Ireland island,巴布亚皮钦语:Niu Ailan),属于巴布亚新几内亚的一个岛屿,是太平洋西南部俾斯麦群岛主要岛屿之一,位于新不列颠岛东北,隔圣乔治海峡与其相望,全岛东西
  • 非晶硅非晶硅(Amorphous silicon, a-Si),又名无定形硅,是硅的一种同素异形体。晶体硅通常呈正四面体排列,每一个硅原子位于正四面体的顶点,并与另外四个硅原子以共价键紧密结合。这种结
  • 詹姆斯·穆迪詹姆斯·保罗·穆迪(英语:James Paul Moody,1887年8月21日 – 1912年4月15日)是英格兰海员,也是英国皇家邮轮泰坦尼克号六副。在泰坦尼克号沉没事故中丧生,遗体从未寻获。1887年8
  • 韦利科·米丘诺维奇韦利科·米丘诺维奇(塞尔维亚语:Вељко Мићуновић,英语:Veljko Micunovic,俄语:Велько Мичунович,1916年1月16日-1982年8月2日)黑山族裔,南斯拉夫社会主义联邦共和国的政治家、外交家。1916年,出生于黑山采蒂涅地区维勒斯托沃村。1934年,入党,任采蒂涅高级中学党组书记。1935年,在贝尔格莱德大学法律系学习。1940年,派到波莫拉夫列州恢复党组织。1941年,组织“黑山七·一三”反法西斯起义。1942年,为南共黑山和博卡省委委员。1943年,任南
  • 马多娜·布莱思马多娜·布莱思(英语:Madonna Blyth,1985年11月30日-),澳大利亚女子曲棍球运动员。她曾代表澳大利亚参加2006年、2010年和2014年英联邦运动会曲棍球比赛,获得三枚金牌。她也曾参加2008年、2012年和2016年夏季奥运会。Template:2016年夏季奥林匹克运动会女子曲棍球比赛澳大利亚队阵容
  • 蔓波人妖秀蔓波人妖秀(泰语:แมมโบคาบาเร่ท์โชว์,英语:Mambo Cabaret Show)位于泰国的首都曼谷府之县的素坤逸路,素坤逸廿二街(Sukhumvit Soi 22)商业中心,曼谷华盛顿广场(英语:Washington Square (Bangkok))里的一个以变性人(由男性变成女性)为主要演员的歌舞表演团体,观众主要来自欧洲、北美洲及日本等地区。今已停业。泰国时间每晚8:00及10:00,共两场。