学习率

✍ dations ◷ 2025-11-20 23:07:38 #学习率

在机器学习和统计学中,学习率(英语:Learning rate)是优化算法中的一个可调参数,它决定了每次迭代的步长,使得优化向损失函数的最小值前进。它影响到新学习到的信息在多大程度上取代了旧信息,暗示了机器学习模型 "学习 "的速度。在自适应控制中,学习率通常被称为增益(Gain)。

设置学习率需要在收敛速度和过冲(Overshooting)之间进行权衡。学习时的前进方向通常由损失函数的负梯度决定,而学习率决定了在这个方向上迈出多大一步。过高的学习率会使迈一大步,超过最小值;但过低的学习率会导致收敛速度变慢,或收敛于局部最小值。

为了加速收敛,防止振荡和陷入不理想的局部极小值,学习率在训练过程中往往按照计划或自适应改变。

初始学习率速率可以参考系统默认值,也可以使用其他方式选择。学习率计划表在学习过程中改变学习率,最常见的是在epochs或iterations之间改变。学习率的改变通常由两个参数决定:衰减(Decay)和动量(Momentum)。目前常见的学习率修改方式是基于时间、基于步骤或基于指数的。衰减的作用是将学习过程稳定在一个好的、没有振荡的位置(当恒定学习率过高时,学习过程可能会在最小值附近震荡)。衰减率通常由超参数控制。

动量类似于从山上滚下来的球,我们希望球在最低点(对应于最低的误差)停留。当梯度方向长期一致时,动量可以加快学习速度(提高学习率),也能通过跳过局部最小值。动量由类似于球质量的超参数控制,而这一参数必须手动选择。当动量过大时,球会滚过希望找到的最小值;当动量过低时,它将不起作用。计算动量的公式比计算衰减的公式更复杂,但在常用的深度学习库(如Keras)中已经实现。

基于时间的学习计划表会根据前一个迭代的学习率改变学习率。考虑到衰减的因素,学习率更新公式为:

η n + 1 = η n 1 + d n {displaystyle eta _{n+1}={frac {eta _{n}}{1+dn}}}

其中 η {displaystyle eta } 是学习率。 d {displaystyle d} 是衰减参数,而 n {displaystyle n} 是迭代步骤。

基于步的学习计划表根据预先定义的步长改变学习率。通常定义为:

η n = η 0 d 1 + n r {displaystyle eta _{n}=eta _{0}d^{leftlfloor {frac {1+n}{r}}rightrfloor }}

其中 η n {displaystyle eta _{n}} 是在第 n {displaystyle n} 步的学习率, η 0 {displaystyle eta _{0}} 初始学习率, d {displaystyle d} 是每次下降时学习率的变化程度(0.5代表减半), r {displaystyle r} 对应下降率(即下降的频率,10代表每10此迭代下降一次)。向下取整函数( {displaystyle lfloor dots rfloor } )将小于1的数改为0。

指数式学习计划表与基于步的学习计划表类似,但使用的不是步,而是递减的指数函数。考虑到衰减的数学公式是:

η n = η 0 e d n {displaystyle eta _{n}=eta _{0}e^{-dn}}

其中 d {displaystyle d} 是衰减参数。

学习率计划表存在的问题是,学习率变换方式取决于超参数,而超参数必须为手动选择。许多不同类型的自适应梯度下降算法解决这个问题(如Adagrad、Adadelta、RMSprop和Adam),这些算法通常内置于深度学习库。

相关

  • Sbsub2/subOsub5/sub五氧化二锑(Sb2O5)是一种锑和氧形成的无机化合物。它通常以水合物Sb2O5·nH2O形式存在,没有确切证据表明制得了无水五氧化二锑。该化合物中锑的氧化态是+5。五氧化二锑的结构与
  • 扎萨克图汗图们(蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang Tig","Menk Qagan Tig","Menk Garqag Tig","Menk Har_a Tig","Menk Scnin Tig","Oyun Gurban Ulus Tig"
  • 伊捷尔缅族伊捷尔缅族(俄语:Ительме́ны ,伊捷尔缅语:Ительмень, итэмэн)是俄罗斯堪察加半岛的本土民族。他们的语言伊捷尔缅语与楚科奇语及科里亚克语形成一个语
  • 盖尔代·奥斯卡盖尔代·奥斯卡(匈牙利语:Gerde Oszkár,1883年7月8日-1944年10月8日),匈牙利犹太裔击剑运动员。他曾参加1908年和1912年夏季奥运会击剑比赛,共获得2枚金牌。1944年,他被驱逐出匈牙
  • “结城友奈是勇者”勇者社活动报告“结城友奈是勇者”勇者部活动报告()是音泉在2014年10月13日到2015年5月25日开始播放的‘结城友奈是勇者’关连的网络广播节目。全32回。从2015年8月10日到2017年9月25日起以
  • 叶在馥叶在馥(1888年-1957年),广东省番禺县人,造船专家。中国造船工程学会创始人之一、大连造船厂建厂委员会总工程师。1888年,生于广东省番禺县,祖籍福建省闽侯县。1903年,考入广东黄埔水
  • 哈菲兹墓哈菲兹墓(حافظیه‎,Hāfezieh)位于伊朗设拉子北部的莫萨拉花园,是14世纪波斯诗人哈菲兹的墓葬和纪念建筑,目前的建筑由法国考古学家和建筑师安德烈·戈达尔于1935年设计,兴
  • 奈拉贾恩杰吉尔奈拉贾恩杰吉尔(Naila Janjgir),是印度恰蒂斯加尔邦Janjgir-Champa县的一个城镇。总人口32495(2001年)。该地2001年总人口32495人,其中男性16841人,女性15654人;0—6岁人口4501人,其
  • 央革河央革河,是位于中国广西壮族自治区百色市西林县西部的一条河流,属于古障河右岸支流,发源于西林县古障镇那哈村(原属者夯乡)北部,西南流经那哈、那友、八索、者夯、央革、勒德等村,于
  • 山口麻美山口麻美(日语:山口 麻美/やまぐち まみ ,1986年8月13日-),日本足球运动员,日本国家女子足球队成员。在2007年7月28日,她代表日本国家女子足球队出赛,在对战美国的比赛中首次​​亮相。从2007年到2011年,他共为国家足球队出场18次,打进8球。她也曾代表日本参加2010年亚足联女子亚洲杯。