带Momentum的SGD优化器有什么优势和劣势?
收藏
一般来说,学习时候或许用的最多的优化器是Adam,但是在工业界,用的最多的优化器是Momentum,那么这个优化器有什么优势?
Momentum优化器,如果初始学习率设置得当并且迭代轮数充足,该优化器会在众多的优化器中脱颖而出,使得其在验证集上获得更高的准确率。
0
收藏
请登录后评论
但是带Momentum优化器有两个劣势,其一是收敛速度慢,其二是初始学习率的设置需要依靠大量的经验。
所以说,一般对精确了要求不是非常严格的场景一般选用Adam。
可以可以,普及知识
Adam确实比较常见了