CosineAnnealingLR
分类: 训练优化
CosineAnnealingLR
定义
按余弦函数曲线周期性衰减学习率的调度策略,使训练在平坦极小值附近充分收敛
数学形式
ηt=ηmin+21(ηmax−ηmin)(1+cos(Tmaxtπ))
核心要点
学习率从 ηmax 平滑衰减到 ηmin,避免阶梯式调度的突变
可设 warm restart(SGDR)实现多周期退火
PyTorch 中 torch.optim.lr_scheduler.CosineAnnealingLR 直接可用
在 Big2Small 中配合 AdamW 使用,Tmax=200
代表工作
SGDR (Loshchilov & Hutter, 2017): 提出余弦退火 + warm restart
Big2Small: 用于 INR 训练的学习率调度
相关概念
AdamW