batch size and learning rate
バッチサイズを k 倍した場合、学習率を √k 倍するべしという論文 (2014) と、k倍するべしという論文 (2017) があるらしい。
How should the learning rate change as the batch size change? - Stack Overflow
大きなミニバッチの効力と、Tensorflowを使って大きなミニバッチを学習させる方法(Gradient Accumulation) | by Akihiro FUJII | Medium