梯度下降算法和不同的学习率

问题描述 投票:0回答:1

在梯度下降算法中,我们是否可以在算法的每次迭代中选择不同的学习率,直到其收敛?

algorithm machine-learning gradient-descent
1个回答
0
投票

是的,有多种方法可以根据epochiteration或损失衍生函数来设置你的超参数。改变梯度下降中的学习率直观地意味着改变步长大小,其中一个权衡是大步长可以逃避局部最优值,但可能需要更多步长才能收敛。通常情况下,开始大步并变小步是有意义的,但有很多更优化的方法可以加速拟合和学习率标量的行为正规化

© www.soinside.com 2019 - 2024. All rights reserved.