Learning Rate
学習率
Gradient Descent / SGD
において
Neural Network
のパラメータを更新する際のステップサイズを決定するハイパーパラメータ
学習率が
高すぎると一度に大きくパラメータが変わりすぎて最適解を飛び越えてしまうリスクがある
低すぎると更新が遅くなり、時間がかかる