超参数 (机器学习)

✍ dations ◷ 2025-11-18 15:33:48 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 窃盗癖窃盗癖是一种心理疾病,是一种冲动控制障碍(Impulse control disorder),患者会有冲动去偷窃商店或私人住宅的东西,但偷来的东西既不是留用,也不是变卖现金,只是为了满足偷窃时的冲动
  • 工党劳工锡安主义(希伯来语:ציונות סוציאליסטית)是锡安主义运动的左翼派别,劳工锡安主义者视自己为历史上中东和中欧的犹太工人运动的一支;不同于主流政治上的锡安
  • 部落客博主(英语:Blogger)一般是指经营博客(英语:Blog)的人。在台湾只要于痞客邦 PIXNET、随意窝 Xuite、Blogger(service)...等免费BSP博客平台注册账户,或使用WordPress系统自架网站,就
  • 玫瑰人生 (电影)《玫瑰人生》(法语:,又名),是2007年发行的一部法国电影。影片叙述法国1930年代至1960年代最著名的女歌手伊迪丝·琵雅芙的戏剧人生。影片以蒙太奇的手法,穿插介绍她的童年趣事、中
  • 科泽科德扎莫林科泽科德扎莫林是一个由印度教教徒奈尔阶级建立的的世袭王室,该王国中世纪时统治著马拉巴尔海岸(今印度喀拉拉邦)。卡利卡特扎莫林从12世纪至18世纪统治长达近600年,将首都设在
  • 罗钦忠罗钦忠(1475年-1529年),字允恕,号西野,江西泰和人,明朝政治人物,进士出身。年二十以《书经》中式三十五名举人,与仲兄同榜。弘治十二年(1499年)会试第八名,殿试二甲第三名,赐进士山身。历
  • 埃卢马莱埃卢马莱(Elumalai),是印度泰米尔纳德邦Madurai县的一个城镇。总人口14030(2001年)。该地2001年总人口14030人,其中男性7051人,女性6979人;0—6岁人口1373人,其中男669人,女704人;识字
  • 宋斗律宋斗律(朝鲜语:송두율,1944年-),哲学社会学学者。出生于日本东京,并在大韩民国光州广域市接受教育。1967年移至西德,1982年始任教于明斯特大学。由于向往北朝鲜的制度,反对朴正熙的独
  • 南昌志道堂南昌志道堂是江西省南昌市主要的基督教堂之一,位于该市民德路112号,前后临湖,东边是八一公园。 志道堂是卫理公会的南赣教区在南昌开辟的四所教堂(清钟堂、新民堂、志道堂、德胜堂)之一,建于1933年,为西方建筑风格。 1958年,南昌全市基督徒集中在应天寺举行联合礼拜,志道堂献给国家,由南昌市工艺美术厂使用。1982年12月25日圣诞节,志道堂举行了复堂典礼,成为南昌第一个恢复开放的基督教堂。该堂有信徒3000人。并被列为江西省文物保护单位。
  • 李金羽李金羽(1977年7月6日-),在中国辽宁省沈阳市出生,退役中国足球运动员。李金羽在1985年4月进入辽宁省体育运动技术学校少年足球训练班。1993年11月入选健力宝青年队第一次赴巴西留学,其间,在165场比赛中打进了近100个球,成为健力宝青年队的首席射手。1996年3月,随健力宝青年队第二次赴巴西留学。1997年1月入选中国国家足球队而提前回国。他也参加了1997年世界青年足球锦标赛。1997年12月第三次赴巴西留学,1998年4月正式学成回国。1998年6月开始代表辽宁参加甲B联赛。9月,他以租借形