超参数 (机器学习)

✍ dations ◷ 2025-11-29 12:03:57 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 白滨对虾白滨对虾(Litopenaeus setiferus)是滨对虾属下的一种虾,生活在北美洲的大西洋沿岸和墨西哥湾中。白滨对虾长度可达197毫米(7.8英寸),雌虾比雄虾大,触须的长度可达体长的三倍。它通
  • 宜阳县宜阳县,是中国河南省洛阳市下辖的一个县。总面积1650.7平方公里,人口67万。唐宋年间宜阳分为福昌县(后唐时曾名福庆县)和寿安县,宋代1072年福昌县并入寿安县,大定年间(1186年)寿安县
  • 纳沙布岬坐标:43°22′N 145°49′E / 43.367°N 145.817°E / 43.367; 145.817纳沙布岬(日语:納沙布岬/のさっぷみさき ),日本北海道最东端的海角,位于根室市。去除离岛的话,为日本本土最
  • 若瑟-马里亚·德·埃雷迪亚若瑟-马里亚·德·埃雷迪亚(法语:José-Maria de Heredia,1842年11月22日-1905年10月3日),出生于古巴圣地亚哥-德古巴的法国诗人,高蹈派的代表人物之一。埃雷迪亚的父亲为西班牙种
  • 横须贺造船所横须贺造船所为德川幕府于横须贺市设立的造船厂。大政奉还后交给明治政府,改由海军省管辖。目前为驻日美军的横须贺海军设施一部分。1866年(庆应元年)德川幕府应勘定奉行小栗忠
  • 1979年铁路此条目列出1979年发生有关铁路运输的事件。
  • 鲁迪·费尔南德斯罗多尔福·“鲁迪”·费尔南德斯·法雷斯(西班牙语:Rodolfo "Rudy" Fernández Farrés,1984年4月4日-),西班牙籍职业篮球运动员。六呎六吋高的费尔南德斯曾效力于NBA,他与开拓者于
  • 1512年
  • 四号坦克四号坦克(德语:Panzerkampfwagen IV),或称IV号坦克,是纳粹德国在第二次世界大战中生产的一款中型坦克。它原本设计目的是支援步兵,并且与专门执行反坦克任务的三号坦克协同作战。在三号坦克的整体性能逐渐不敷二次大战中期装甲战斗需要时,四号坦克因所使用的技术较为成熟而比三号坦克有更大的改良空间,因此在不断改进的过程中,四号坦克逐渐成为装甲师装备的主力车种。四号坦克较大的改良空间亦使其较为容易改装,既有改造为突击炮、坦克歼击车,也有改造为弹药运送车、架桥坦克等,成为用途最广泛的坦克。从投产至二战
  • 天卫七天卫七,是天王星的卫星,名为“欧菲莉亚”(Ophelia)。名字来自莎士比亚的悲剧《哈姆雷特》(Hamlet, 又称“王子复仇记”)中的女主人公欧菲莉亚(英语:Ophelia)。(另有一颗小行星的名字也叫做“欧菲莉亚”,即小行星171)。天卫七是位于天王星第11行星环边缘以外的卫星,它的轨道在天王星的同步轨道半径之内,因此受潮汐力的影响会逐渐接近天王星。1986年1月20日,天卫七被美国的旅行者2号发现,当时临时命名为S/1986 U 8 2003年,通过哈勃望远镜才被正式看到。