炼丹术——可变学习率训练 作者: icfg66 时间: 2021-06-29 分类: 神经网络,算法 评论 学习率对网络训练的效果影响很大,一般来看,越到后面,学习率要越小,手动可以调节,但可变学习率会更方便。还有一种更骚的操作是warm up学习,学习率早期先增大预热,再减小...