百度强化学习7日打卡训练营学习心得与感受
收藏
百度强化学习7日打卡训练营学习心得与感受
百度七日强化学习链接视频 https://aistudio.baidu.com/aistudio/education/group/info/1335
首先感谢百度提供了这么一门课程的学习机会,并且提供AIStdio这么个平台来供学员实践与运用所学到的东西。同时也感谢科科老师与班主任这天的付出,让我这个对强化学习一窍不通的小白能够了解到强化学习的这么一个领域,并且能用它来解决一些问题,获得一些启发。
课程一共5节课,从经典的SARSA,Q-Learning,再到基于神经网络的DQN,基于策略梯度的PG算法,以及连续动作空间的DDPG 算法。从离散到连续,从经典算法到神经网络。课程难度也随之逐步上升。科科老师讲的很好思路清晰,而且举例也十分的贴切。前面的部分接受的较快,但是后面的部分就有些发懵了,通过回放多看几遍,坚持听完还是收获蛮多的。最直接的收获就是了解到强化学习的训练模型与算法,并且能够认识与使用PARL这么一个框架。还有就是与之前学习的监督学习相比,监督学习更像是有明确目标并且向目标奋斗,而强化学习更像是在黑暗中探索,使自己更好的适应当前的环境,从而打到预期的目标。
同时课程也安排了大量的动手实践。通过观察强化学习训练的过程,感觉模型的训练的过程就是人不断试错的过程。通过不断的试错来优化模型,通过经验函数来选择更佳的过程。在动手实践的过程中我们也在不断的提升。怎么说呢,有一种模型与人一起共同成长的感觉ヽ( ̄ω ̄( ̄ω ̄〃)ゝ。就是有时候模型死活都不收敛XD。遇到问题,讨论区也有各类大神讨论解决,微信群也有积极的讨论,学习体验极佳。
希望以后还能推出相关的课程,同时祝愿百度飞桨平台越做越大。
0
收藏
请登录后评论
收获很大