强化学习7日体会
137*****812 发布于2020-06 浏览:1176 回复:0
0
收藏
快速回复

    近日参加了百度强化学习7日线上学习,初步了解了强化学习的基本概念。

    第一课:初时强化学习

     1. 强化学习的概念及应用
     2. 强化学习的核心知识
     3. GYM、PARL
    第二课:基于表格型方法求解RL

     1. Sarsa 和 Q-Learning 算法
     2. MDP 和 Q表格
     3. 强化概念、TD更新等
     4. 代码解析

    第三课:基于神经网络方法求解RL

     1. DQN 算法
     2. 函数逼近与神经网络
     3. DQN算法解析
     4. PARLDQN代码
     5. DQN训练展示

    第四课:基于策略梯度求解RL

     1. Policy_Gradient
     2. 随机策略与策略梯度
     3. PG算法
     4. PG代码解析

    第五课:连续动作空间上求解RL

     1. DDPG 算法
     2. 连续动作空间
     3. DDPG代码与总结

 

收藏
点赞
0
个赞
TOP
切换版块