学习率

✍ dations ◷ 2025-12-03 19:08:46 #学习率

在机器学习和统计学中,学习率(英语:Learning rate)是优化算法中的一个可调参数,它决定了每次迭代的步长,使得优化向损失函数的最小值前进。它影响到新学习到的信息在多大程度上取代了旧信息,暗示了机器学习模型 "学习 "的速度。在自适应控制中,学习率通常被称为增益(Gain)。

设置学习率需要在收敛速度和过冲(Overshooting)之间进行权衡。学习时的前进方向通常由损失函数的负梯度决定,而学习率决定了在这个方向上迈出多大一步。过高的学习率会使迈一大步,超过最小值;但过低的学习率会导致收敛速度变慢,或收敛于局部最小值。

为了加速收敛,防止振荡和陷入不理想的局部极小值,学习率在训练过程中往往按照计划或自适应改变。

初始学习率速率可以参考系统默认值,也可以使用其他方式选择。学习率计划表在学习过程中改变学习率,最常见的是在epochs或iterations之间改变。学习率的改变通常由两个参数决定:衰减(Decay)和动量(Momentum)。目前常见的学习率修改方式是基于时间、基于步骤或基于指数的。衰减的作用是将学习过程稳定在一个好的、没有振荡的位置(当恒定学习率过高时,学习过程可能会在最小值附近震荡)。衰减率通常由超参数控制。

动量类似于从山上滚下来的球,我们希望球在最低点(对应于最低的误差)停留。当梯度方向长期一致时,动量可以加快学习速度(提高学习率),也能通过跳过局部最小值。动量由类似于球质量的超参数控制,而这一参数必须手动选择。当动量过大时,球会滚过希望找到的最小值;当动量过低时,它将不起作用。计算动量的公式比计算衰减的公式更复杂,但在常用的深度学习库(如Keras)中已经实现。

基于时间的学习计划表会根据前一个迭代的学习率改变学习率。考虑到衰减的因素,学习率更新公式为:

η n + 1 = η n 1 + d n {displaystyle eta _{n+1}={frac {eta _{n}}{1+dn}}}

其中 η {displaystyle eta } 是学习率。 d {displaystyle d} 是衰减参数,而 n {displaystyle n} 是迭代步骤。

基于步的学习计划表根据预先定义的步长改变学习率。通常定义为:

η n = η 0 d 1 + n r {displaystyle eta _{n}=eta _{0}d^{leftlfloor {frac {1+n}{r}}rightrfloor }}

其中 η n {displaystyle eta _{n}} 是在第 n {displaystyle n} 步的学习率, η 0 {displaystyle eta _{0}} 初始学习率, d {displaystyle d} 是每次下降时学习率的变化程度(0.5代表减半), r {displaystyle r} 对应下降率(即下降的频率,10代表每10此迭代下降一次)。向下取整函数( {displaystyle lfloor dots rfloor } )将小于1的数改为0。

指数式学习计划表与基于步的学习计划表类似,但使用的不是步,而是递减的指数函数。考虑到衰减的数学公式是:

η n = η 0 e d n {displaystyle eta _{n}=eta _{0}e^{-dn}}

其中 d {displaystyle d} 是衰减参数。

学习率计划表存在的问题是,学习率变换方式取决于超参数,而超参数必须为手动选择。许多不同类型的自适应梯度下降算法解决这个问题(如Adagrad、Adadelta、RMSprop和Adam),这些算法通常内置于深度学习库。

相关

  • 原核翻译启动原核翻译(Prokaryotic translation)是指原核生物细胞中信使RNA被70S核糖体翻译为蛋白质的过程。该过程可分为起始、延伸、终止与再循环四个主要步骤。原核生物的翻译起始阶段
  • 凤爪凤爪,等于是鸡爪,广东文化中常用“凤”来代替“鸡”一字,一般是把鸡的爪,经过烹制,作为小吃,可以啃半天,吃的满嘴滋味,但没有吃进多少东西,不至于吸收太多。是嘴馋又怕肥的人的好食品
  • 超速传动超速传动是一种传动部件,常用于后轮驱动汽车,让行驶车辆得到极高的齿轮传动比以获得高速的巡航能力,同时在较低扭矩的情况下节省燃料。“超速传动”一词也可以指传动系统中通过
  • 孝义柿子孝义柿子,是中华人民共和国山西省吕梁市孝义市的柿子品种。是中国地理标志产品。孝义柿树产量高、寿命长。当地主要品种有磨盘柿、牛心柿等优良品种,其产地主要分布于孝义市境
  • 法语人名列表此列表为法语人名的中文译名,不包括姓氏。FannyNina 妮娜
  • 何塞·黎刹级巡防舰巡航: 15 kn(27.8 km/h;17.3 mph)1座ASELSAN(英语:ASELSAN) SMASH 30mm 机炮 4挺 S&T Motiv 12.7mm K6 机枪 1座近迫武器系统 (FFBNW)2具双联装欧洲导弹集团(英语:MBDA)短程防空导
  • 弈秋弈秋(?-?),战国时期齐国围棋手,也是中国历史上第一位文字记载的围棋手。弈秋的事迹最早见于《孟子·告子》,是孟子在对齐王讲述治理国家的道理时援引了弈秋的故事,故事内容大意是弈秋
  • Supermodel 2018 Survival《Supermodel 2018 Survival》(韩语:슈퍼모델 2018 서바이벌)为韩国SBS Plus(朝鲜语:SBS 플러스)于2018年推出的综艺节目,由徐章勋、张允柱、金元中(朝鲜语:김원중 (모델))、金秀路、S
  • 勒乌德莫里乡坐标:.mw-parser-output .geo-default,.mw-parser-output .geo-dms,.mw-parser-output .geo-dec{display:inline}.mw-parser-output .geo-nondefault,.mw-parser-output .geo-multi-punct{display:none}.mw-parser-output .longitude,.mw-parser-output .latitude{white-space:n
  • 裴垍裴垍(8世纪?-811年),字弘中,绛州闻喜人,出自河东裴氏定着五房之一的东眷裴,隋朝太子斋帅、内直监裴师道七代孙,高陵县县令裴昱第二子,唐朝官员,曾为宰相。裴垍生年没有可靠记载,弱冠时进士出身,以贤良方正对策第一,补美原县县尉。累迁翰林学士、中书舍人,元和三年(808年),拜中书侍郎、同中书门下平章事。一生为国尽心尽力,“小心敬慎,甚称中旨。”“垍守正不受请托,考核皆务才实。”,他尽力完善法律制度,年方四十四岁,须发尽白。元和初年叙任中书舍人,当时李吉甫方拜相,不知该如何用人,便向裴垍请教。垍随即列出三