超参数 (机器学习)

✍ dations ◷ 2025-11-25 16:26:09 #超参数 (机器学习)

在机器学习中,超参数(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。而其他参数(例如节点权重)的值是通过训练得出的。

超参数可分为模型超参数(Model Hyperparameters)和算法超参数(Algorithm Hyperparameters)。模型超参数主要用于模型选择,其无助于学习训练集特征;而算法超参数理论上对模型的性能没有影响,而会影响学习的速度和质量。一个典型的模型超参数是神经网络的拓扑结构及大小;而学习率和批量大小(Batch size)、小批量大小(Mini-Batch size)则是典型的算法超参数。

不同的模型训练算法需要用到不同的超参数,一些简单的算法(如普通最小二乘回归)不需要超参数。给定超参数,训练算法会从数据中学习参数。例如,LASSO算法在普通最小二乘回归中加入正则化超参数,在通过训练算法估计参数之前,必须先设置这个超参数。

对模型的训练和测试所需的时间可能取决于其超参数的选择。

一个超参数通常是实数或是整数,因此存在混合型的优化问题。一些超参数的选取依赖于其他参数的值(例如神经网络每个隐藏层的大小可以与层的数量相关)。

超参数通常并不能使用梯度类算法(例如梯度下降、LBFGS)来学习;这些梯度类算法通常用于学习其它参数。这些用于描述模型的超参数通常不能用一般的优化方法学习,然而它们仍然会影响损失函数。例如支持向量机中错误的容忍度超参数。

部分超参数不能从训练数据中学习,因为对部分超参数的学习过程通常会过分增加模型容量,并使损失函数趋于不希望的小值(即过拟合),而不是正确映射数据的结构。例如,如果我们将拟合回归模型的多项式方程的度数作为一个可训练参数,多项式的度数会增加到模型可以完全拟合数据,此时训练误差极低,但泛化性能差。

性能变化往往归因于个别几个超参数。算法、超参数或相互作用超参数的可调性用于衡量对其调整可以获得多少性能的标准。对于LSTM来说,学习率和网络大小是关键的超参数,而批量(Batching)和动量(Momentum)则对其性能没有显著影响。

部分研究主张小批量大小(Mini-Batch size)应该为数千,而其他研究表明,小批量大小在2到32之间的性能最好。

学习中存在的随机性表明经验性的超参数选取并不一定反应其真实性能。如果方法对超参数、随机数种子、甚至算法的不同实现方式的简单变化不具有稳健性,则在不进行简化和稳健化前,不能被集成到关键任务的控制系统中。

强化学习算法不仅需要在大量的随机种子上测量它们的性能,还需要测试对超参数选择的敏感性。由于变异性,仅用少量的随机种子进行的评估并不能充分反应出性能。部分强化学习方法(例如Deep Deterministic Policy Gradient,DDPG)对超参数的选择比其他算法更敏感。

超参数优化找到一个超参数的元组(Tuple),产生一个最佳模型,使得给定测试数据集的损失函数最小。目标函数接收超参数的元组,并返回对应的损失。

除超参数的调整外,机器学习还涉及到参数和结果的存储和组织,并确保它们是可重复的。

相关

  • 高加索语系高加索语言泛指来源于高加索地区的语言,共同结合为高加索语系,其归属及分类均存争议。一般来说,高加索语言分为2或3种语系或语族,包括西北高加索语系、东北高加索语系和南高加索
  • 鲨烯鲨烯(Squalene),又称角鲨烯,是一种开链三萜类化合物。因最初从鲨鱼肝油中提取得到,故得名鲨烯。随后发现鲨鱼卵油及其他鱼中也含有它,现在发现它的分布比预想的要广泛许多,真菌及人
  • ð̠浊齿龈擦音是辅音的一种。和此音对应的国际音标符号会因为此音是否有咝音还是无咝音而有所改变:吴语中的属有咝音,据邪俟船子音而定,均属阳调。浊齿龈有咝音的特征:英语中有此音
  • 姑苏繁华图《姑苏繁华图》,又称《盛世滋生图》,是清代画家徐扬所绘反映苏州城繁华盛况的画作,绘制于公元1759年,目前藏于辽宁省博物馆,属于国家一级文物。徐扬总共花费了24年时间才画成此图
  • DD-WRTDD-WRT是一个基于Linux的无线路由固件,以GNU通用公共许可证(GPL)V2许可发布。DD-WRT提供了许多一般路由器固件所没有的功能,例如支持XLink Kai游戏协议、基于守护进程的服务、IP
  • 美国航空1420号班机空难美国航空1420班机是从美国达拉斯-沃斯堡国际机场飞往小石城的美国航空航班。1999年6月1日晚上,一架MD-82(注册号N215AA)飞行时,在小石城因着陆冲出跑道而坠毁。根据NTSB的报告,14
  • 张歆艺张歆艺(1981年5月29日-),中国女演员,四川资阳人。1998年毕业于四川艺术职业学院,之后在深圳市歌舞团当演员,2001年进入中央戏剧学院表演系学习,出演过多部话剧和影视剧。张歆艺与王志飞(1965年3月20日-)2005年因合作结缘,相恋七年,后分手。2012年10月10日,张歆艺承认与导演杨树鹏(1970年5月4日-)交往。2013年5月跟杨树鹏结婚,2014年10月底张歆艺和杨树鹏微博承认离婚。与演员袁弘(1982年8月23日-)现为夫妻关系,二人婚礼于2016年5月30日在德国古城堡举行。
  • 琳赛·梦露琳赛·梦露是一个CSI犯罪现场:纽约剧集中的警探角色, 由安娜·贝尔纳普所饰演.琳赛在蒙大拿州的博兹曼市成长,她的一些举动在她的同事眼中看起来很奇怪,例如她会先脱鞋后再进入嫌犯家里,但就本质上而言,她对于来自小城镇的受害者似乎特别敏感。在她来到纽约的十年前,一个牵涉到一个女服务生与琳赛的三个好朋友的凶杀案,她是唯一的目击证人。该事件促使她想要成为一个犯罪现场调查员,尽管她对那个事件还存在着深深的恐惧,并且发现自己很难跟犯罪受害者的母亲们沟通,特别是看到那些年纪轻轻就殒落的女生。剧中,琳赛在被她的主管麦克·
  • 伊沃·达内乌伊沃·达内乌(斯洛文尼亚语:Ivo Daneu,1937年10月6日-),斯洛文尼亚男子篮球运动员。他曾代表南斯拉夫国家队参加1960年、1964年和1968年夏季奥林匹克运动会篮球比赛,获得一枚银牌。
  • 尚博伯爵亨利尚博伯爵和波尔多公爵亨利(法语:Henri, Comte de Chambord, Duc de Bordeaux,1820年9月29日-1883年8月24日),全名亨利·夏尔·斐迪南·马里·迪厄东内(Henri Charles Ferdinand Marie Dieudonné),或称阿图瓦的亨利(Henri d'Artois)、亨利五世,1844年—1883年为法国波旁王朝正统派王位觊觎者。亨利是查理十世(当时还是阿图瓦伯爵)的次子贝里公爵夏尔-斐迪南与其妻两西西里国王弗朗切斯科一世的女儿两西西里的玛