强化学习7日打卡营-世界冠军带你从零实践学习心得
飞龙学涯 发布于2020-06 浏览:1446 回复:0
0
收藏


课节1:预习课程。该部分内容充实,非常适合零基础同学入门,而且该部分内容图文搭配、详实得当,最给力的是第三课-Python快速入门给出了许多代码实例,让学习者对知识的理解和代码实践均有较大的收获。PaddlePaddle快速入门知识简单、易懂,只是感觉该部分知识少了一丢丢,本来特别想学习这部分的知识,可惜该部分知识没像其他平台如:Pytorch、Keras那样层次性的展列,当然仅是个人感觉。 AI Studio基本操作-做的很棒,如同本地般conda-notebook操作,只是离线后会断掉。重新开启环境时,进入页面后会提示项目运行中,但看不到运行进度,这点有点困惑。
课节2:强化学习(RL)初印象,这是我听的最认真的一次课,内容特别棒,6个部分的内容,层层递进,加之科科老师很用心的讲解,非常受益,课后作业安排很合理。
课节3:表格型方法Sarsa和Q-learning,科科老师讲解的很不错,分析两者的区别以及优缺点,剖析到位,对于刚入门的我,对On-Policy与Off-Policy的理解仍需努力。
课节4:神经网络方法求解RL,科科老师对DQN的讲解到位,特别分析了该算法的两大亮点:经验回放、固定Q目标,同时对神经网络的分析到位,对DQN和神经网络的知识学习均受益颇多。
课节5:策略梯度方法求解RL,老师对这部分内容的讲解很好,基于值和基于策略的分析到位,但对策略梯度的理解和用于策略网络优化等方面的知识还需加强。
课节6:连续动作空间上求解RL,科科老师对DDPG算法分析不错,不仅区分了离散动作和连续动作知识,还对评论家-演员框架进行了讲解,代码解析到位,收获颇多的一次课节。
总体感觉课程设计非常不错,内容层层递进,从课前知识——》概念——》算法——》神经网络——》连续动作空间,知识一环扣一环,非常适合初学者入门。而个人感到遗憾的是没有充分保障学习时间,因为其他杂事耽误了课程内容的学习,后期定会跟进学习,同时补充AI Studio平台其他课程的学习,更加熟悉PaddlePaddle环境。

收藏
点赞
0
个赞
TOP
切换版块