强化学习7日营体会
收藏
这几天学习了《强化学习7日营》,颇有体会,写一下心得总结。
主要收获:
1. 学习了parl
2. 学习了pg,q-learning,sarsa,dqn,ddpg等算法
3. 学习了强化学习建模。强化学习在推荐系统中的reward可以定义为用户反馈,状态可以定义为上下文信息还有浏览历史,action可以定义为推荐列表
4. 强化学习的优势是动态时序建模和优化用户长期兴趣
5. 还有个大作业可以好好做,哈哈。
课程浅显易懂,老师讲的也不错,但后续还要自己钻研。希望以后出pgl相关的课程。
0
收藏
请登录后评论
有没有课程回放的地址?
报名了就可以看回放。