学习率

✍ dations ◷ 2025-01-06 04:18:15 #学习率

在机器学习和统计学中,学习率(英语:Learning rate)是优化算法中的一个可调参数,它决定了每次迭代的步长,使得优化向损失函数的最小值前进。它影响到新学习到的信息在多大程度上取代了旧信息,暗示了机器学习模型 "学习 "的速度。在自适应控制中,学习率通常被称为增益(Gain)。

设置学习率需要在收敛速度和过冲(Overshooting)之间进行权衡。学习时的前进方向通常由损失函数的负梯度决定,而学习率决定了在这个方向上迈出多大一步。过高的学习率会使迈一大步,超过最小值;但过低的学习率会导致收敛速度变慢,或收敛于局部最小值。

为了加速收敛,防止振荡和陷入不理想的局部极小值,学习率在训练过程中往往按照计划或自适应改变。

初始学习率速率可以参考系统默认值,也可以使用其他方式选择。学习率计划表在学习过程中改变学习率,最常见的是在epochs或iterations之间改变。学习率的改变通常由两个参数决定:衰减(Decay)和动量(Momentum)。目前常见的学习率修改方式是基于时间、基于步骤或基于指数的。衰减的作用是将学习过程稳定在一个好的、没有振荡的位置(当恒定学习率过高时,学习过程可能会在最小值附近震荡)。衰减率通常由超参数控制。

动量类似于从山上滚下来的球,我们希望球在最低点(对应于最低的误差)停留。当梯度方向长期一致时,动量可以加快学习速度(提高学习率),也能通过跳过局部最小值。动量由类似于球质量的超参数控制,而这一参数必须手动选择。当动量过大时,球会滚过希望找到的最小值;当动量过低时,它将不起作用。计算动量的公式比计算衰减的公式更复杂,但在常用的深度学习库(如Keras)中已经实现。

基于时间的学习计划表会根据前一个迭代的学习率改变学习率。考虑到衰减的因素,学习率更新公式为:

η n + 1 = η n 1 + d n {displaystyle eta _{n+1}={frac {eta _{n}}{1+dn}}}

其中 η {displaystyle eta } 是学习率。 d {displaystyle d} 是衰减参数,而 n {displaystyle n} 是迭代步骤。

基于步的学习计划表根据预先定义的步长改变学习率。通常定义为:

η n = η 0 d 1 + n r {displaystyle eta _{n}=eta _{0}d^{leftlfloor {frac {1+n}{r}}rightrfloor }}

其中 η n {displaystyle eta _{n}} 是在第 n {displaystyle n} 步的学习率, η 0 {displaystyle eta _{0}} 初始学习率, d {displaystyle d} 是每次下降时学习率的变化程度(0.5代表减半), r {displaystyle r} 对应下降率(即下降的频率,10代表每10此迭代下降一次)。向下取整函数( {displaystyle lfloor dots rfloor } )将小于1的数改为0。

指数式学习计划表与基于步的学习计划表类似,但使用的不是步,而是递减的指数函数。考虑到衰减的数学公式是:

η n = η 0 e d n {displaystyle eta _{n}=eta _{0}e^{-dn}}

其中 d {displaystyle d} 是衰减参数。

学习率计划表存在的问题是,学习率变换方式取决于超参数,而超参数必须为手动选择。许多不同类型的自适应梯度下降算法解决这个问题(如Adagrad、Adadelta、RMSprop和Adam),这些算法通常内置于深度学习库。

相关

  • 大麻二酚大麻二酚(Cannabidiol,CBD)是大麻百多只有效成分中最具医疗价值的一种,有保护神经、改善皮肤发炎、抗氧化、舒缓皮肤敏感泛红、为皮肤表层建立保护屏障、改善皮肤自我修复力;对恢
  • 时装时装(英文:Fashion),一般指某时期流行的时尚服装,包配服装配饰在内,配饰一般包括例如伞、眼镜、手袋、首饰等等所有配戴在个人身上的东西,令时装不再局限于衣服,开阔了其广度。纽约
  • 辣椒粉辣椒粉,又称辣椒面,是干燥后的辣椒磨成的碎片或粉末。根据粗细不同,英文会区分辣椒片(chili flake)和辣椒粉(chili powder),但中文里常通称辣椒粉。几乎世界各地的料理都有在烹调过
  • 内华达山脉内华达山脉(英语:Sierra Nevada),中文又音谢拉内华达,雪乐山 是一条纵贯美国加利福尼亚州东部的山脉。部分山体也位于内华达州境内。内华达山脉的最高峰是惠特尼峰,标高4,418 m。
  • 克莱儿·芙伊克莱尔·伊丽莎白·芙伊(英语:Claire Elizabeth Foy,1984年4月16日-)是一位英国女演员。2016年起,芙伊在Netflix原创电视剧《王冠》首两季中主演年轻的伊丽莎白二世女王。该剧和芙
  • 聚合瘦果聚合瘦果是与蔷薇果类似的另一类聚合果。由一朵花的子房发育而成,在此类植物的花常常有离生心皮雌蕊,每枚雌蕊各自发育成一个相对独立的果实,最终形成聚集在一个花萼上的聚合瘦
  • 李科颖李科颖(英语:Ke-Ying Lee,1992年8月17日-),台湾台北市人,毕业于东南科技大学,台北西门町及信义计划区知名街头艺人,曾多次上新闻接受采访。
  • 监物永三监物永三(1948年2月13日-)是一位日本体操选手,也是奥运金牌得主,出生在冈山县冈山市,毕业于日本体育大学。目前为日本体育大学教授与日本体操协会副会长。
  • 英国电信集团英国电信集团(BT Group plc,以BT为商标,前身为British Telecom,简称BT),原为英国国营电信公用事业,由英国邮政总局管理,1981年10月1日脱离英国皇家邮政,变成独立的国营事业。在英国保
  • 屏5线屏5线 南郡-源泉,是位于台湾屏东县的一条乡道,属于屏东县乡道系统。起点屏东县高树乡长荣村,终点屏东县高树乡源泉村,全长2.437公里,路线线型为东西向。