学习率

✍ dations ◷ 2025-12-02 03:20:08 #学习率

在机器学习和统计学中,学习率(英语:Learning rate)是优化算法中的一个可调参数,它决定了每次迭代的步长,使得优化向损失函数的最小值前进。它影响到新学习到的信息在多大程度上取代了旧信息,暗示了机器学习模型 "学习 "的速度。在自适应控制中,学习率通常被称为增益(Gain)。

设置学习率需要在收敛速度和过冲(Overshooting)之间进行权衡。学习时的前进方向通常由损失函数的负梯度决定,而学习率决定了在这个方向上迈出多大一步。过高的学习率会使迈一大步,超过最小值;但过低的学习率会导致收敛速度变慢,或收敛于局部最小值。

为了加速收敛,防止振荡和陷入不理想的局部极小值,学习率在训练过程中往往按照计划或自适应改变。

初始学习率速率可以参考系统默认值,也可以使用其他方式选择。学习率计划表在学习过程中改变学习率,最常见的是在epochs或iterations之间改变。学习率的改变通常由两个参数决定:衰减(Decay)和动量(Momentum)。目前常见的学习率修改方式是基于时间、基于步骤或基于指数的。衰减的作用是将学习过程稳定在一个好的、没有振荡的位置(当恒定学习率过高时,学习过程可能会在最小值附近震荡)。衰减率通常由超参数控制。

动量类似于从山上滚下来的球,我们希望球在最低点(对应于最低的误差)停留。当梯度方向长期一致时,动量可以加快学习速度(提高学习率),也能通过跳过局部最小值。动量由类似于球质量的超参数控制,而这一参数必须手动选择。当动量过大时,球会滚过希望找到的最小值;当动量过低时,它将不起作用。计算动量的公式比计算衰减的公式更复杂,但在常用的深度学习库(如Keras)中已经实现。

基于时间的学习计划表会根据前一个迭代的学习率改变学习率。考虑到衰减的因素,学习率更新公式为:

η n + 1 = η n 1 + d n {displaystyle eta _{n+1}={frac {eta _{n}}{1+dn}}}

其中 η {displaystyle eta } 是学习率。 d {displaystyle d} 是衰减参数,而 n {displaystyle n} 是迭代步骤。

基于步的学习计划表根据预先定义的步长改变学习率。通常定义为:

η n = η 0 d 1 + n r {displaystyle eta _{n}=eta _{0}d^{leftlfloor {frac {1+n}{r}}rightrfloor }}

其中 η n {displaystyle eta _{n}} 是在第 n {displaystyle n} 步的学习率, η 0 {displaystyle eta _{0}} 初始学习率, d {displaystyle d} 是每次下降时学习率的变化程度(0.5代表减半), r {displaystyle r} 对应下降率(即下降的频率,10代表每10此迭代下降一次)。向下取整函数( {displaystyle lfloor dots rfloor } )将小于1的数改为0。

指数式学习计划表与基于步的学习计划表类似,但使用的不是步,而是递减的指数函数。考虑到衰减的数学公式是:

η n = η 0 e d n {displaystyle eta _{n}=eta _{0}e^{-dn}}

其中 d {displaystyle d} 是衰减参数。

学习率计划表存在的问题是,学习率变换方式取决于超参数,而超参数必须为手动选择。许多不同类型的自适应梯度下降算法解决这个问题(如Adagrad、Adadelta、RMSprop和Adam),这些算法通常内置于深度学习库。

相关

  • 太湖猪太湖猪是家猪的品种之一,起源于中国长江下游太湖流域一带。形体庞大,色黑。双耳下垂且面部带有褶皱。有多个品系,有学者视其为不同的猪种。太湖猪对疾病有高抵抗力,而又有较强的
  • 基辅国立贸易经济大学坐标:50°27′57″N 30°38′17″E / 50.46583°N 30.63806°E / 50.46583; 30.63806基辅国立贸易经济大学 (乌克兰语:Київський національний торг
  • 塔洛杰潘奇纳德塔洛杰潘奇纳德(Taloje Panchnad),是印度马哈拉施特拉邦Raigarh县的一个城镇。总人口10858(2001年)。该地2001年总人口10858人,其中男性5903人,女性4955人;0—6岁人口1909人,其中男10
  • 特迪·里内特迪·里内(法语:Teddy Riner,1989年4月7日-)生于皮特尔角城,是一名法国男子柔道运动员。曾获得2008年奥运男子柔道100公斤以上级铜牌、2012年和2016年奥运男子柔道100公斤以上级
  • 宋翼弼宋翼弼(1534年2月10日-1584年8月8日)本贯砺山宋氏、字云长、号龟峰·玄绳、谥号文敬、朝鲜半岛后世尊称其为宋龟峰或龟峰先生。韩国李氏朝鲜的庶子出身儒学者及政治人,作家,诗人
  • 倭肯河倭肯河位于中华人民共和国黑龙江省东部,是松花江右岸支流,河名为满语“石头”(满语:ᠸᡝᡥᡝ,转写:)的音转。倭肯河发源于七台河市新兴区东北端完达山北麓冷寒宫南侧,蜿蜒向西南流经
  • 埃米尔·拜加津埃米尔·肯萨加济维奇·拜加津(哈萨克语:Эмир Кенжеғазыұлы Байғазин;俄语:Эмир Кенжегазиевич Байгазин;英语:Emir Kenzhegaz
  • 菲利普·戴高乐菲利普·戴高乐(法语:Philippe de Gaulle,1921年12月28日-),法国的政治家,海军上将,是法国总统夏尔·戴高乐与伊冯娜·戴高乐的大儿子,曾担任担任
  • 国民经济学国民经济学(Volkswirtschaftslehre,英语化的写法是Nationalökonomie),传统上称作经济国家科学(wirtschaftliche Staatswissenschaften, VWL),是德语学术传统中经济学(Wirtschaftswissenschaft)的两大分支之一,另一是工商管理(Betriebswirtschaftslehre),也被视作狭义上的经济学,包括微观经济学(Mikroökonomie)和宏观经济学(Makroökonomie)。国民经济学致力于解决资源稀
  • 伯尼·比克斯达夫伯纳德·泰隆·“伯尼”·比克斯达夫(英语:Bernard Tyrone "Bernie" Bickerstaff,1944年11月2日-),NBA前职业篮球教练。他在圣迭戈大学待了十年,其间担任过球员、助理教练和主教练。1964年—1966年期间,比克斯达夫在圣迭戈大学斗牛士队打球并且在大学四年级时成为球队队长和最有价值球员,比克斯达夫也是Kappa Alpha Psi兄弟会成员。比克斯达夫在执教生涯中取得了414胜和512负,取胜场次排列NBA的第33位。他在许多NBA球队中担任过诸多位置,包括总经理和