最近在研究神经网络的 Adam 优化。我对 Kingma & Ba 论文中写的 t 的迭代公式感到困惑。其中 t 是迭代。为什么 t=t+1?
意思是如果t=3, 3=3+1 所以3=4? 为什么迭代 3 等于迭代 4?