强化学习7日的心得体会

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

遥遥望发布于2020-06

前几天参加了强化学习入门的7日打卡营，这是我参加百度人工智能7日打卡营的第三期了，算起来百度带我入门人工智能已经两个月了。

这次学习最大的收获是增长了见识。之前我对人工智能的了解还停留在深度学习阶段，只学习了深度学习在CV和NLP方面的简单知识，这次打卡营我首次知道了强化学习的概念。在我看来，深度学习是对已知的学习，而强化学习是对未知的探索。说得具体点，深度学习训练模型有一个具体的lable去指导模型学习，而强化学习只有环境给予的reward反馈，需要自行根据reward来设计指导的loss函数。从这可以看出，强化学习相比于深度学习的不确定性，然而，强化学习的不确定性还不只这些。例如想深度学习一般朝参设置对了，loss值一般收敛得到比较好，而给我的感觉像是要学习到一定程度后reward才会明显上升，而且深度学习一般loss值前期收敛得比较快，后面收敛得比较慢，而强化学习，如我上面所说，刚开始reward的值收敛的很慢甚至是不收敛，得学习到一定程度才开始收敛，这就给人一种不知道自己参数设置对不对的感觉，不敢挂很长时间让程序一直跑。当然，这次课程还是深入浅出地带我入门了强化学习，在这里要感谢班主任芮芮和主讲的科科老师，科科老师的认真与负责也是让我深受鼓舞。

以上就是我在本次打卡营后的一点体会，本人也只是刚入门，没有深入地研究强化学习，以后再抽空好好学一学，炼丹之路，道阻且长。

0

收藏

回复

全部评论(1)

AIStudio810258

#2 回复于2020-06

收货不少～～

我也一直跟着课程

加油！共同进步！

0

回复