强化学习7日的心得体会
收藏
前几天参加了强化学习入门的7日打卡营,这是我参加百度人工智能7日打卡营的第三期了,算起来百度带我入门人工智能已经两个月了。
这次学习最大的收获是增长了见识。之前我对人工智能的了解还停留在深度学习阶段,只学习了深度学习在CV和NLP方面的简单知识,这次打卡营我首次知道了强化学习的概念。在我看来,深度学习是对已知的学习,而强化学习是对未知的探索。说得具体点,深度学习训练模型有一个具体的lable去指导模型学习,而强化学习只有环境给予的reward反馈,需要自行根据reward来设计指导的loss函数。从这可以看出,强化学习相比于深度学习的不确定性,然而,强化学习的不确定性还不只这些。例如想深度学习一般朝参设置对了,loss值一般收敛得到比较好,而给我的感觉像是要学习到一定程度后reward才会明显上升,而且深度学习一般loss值前期收敛得比较快,后面收敛得比较慢,而强化学习,如我上面所说,刚开始reward的值收敛的很慢甚至是不收敛,得学习到一定程度才开始收敛,这就给人一种不知道自己参数设置对不对的感觉,不敢挂很长时间让程序一直跑。当然,这次课程还是深入浅出地带我入门了强化学习,在这里要感谢班主任芮芮和主讲的科科老师,科科老师的认真与负责也是让我深受鼓舞。
以上就是我在本次打卡营后的一点体会,本人也只是刚入门,没有深入地研究强化学习,以后再抽空好好学一学,炼丹之路,道阻且长。
0
收藏
请登录后评论
收货不少~~
我也一直跟着课程
加油!共同进步!