强化学习七日打卡营学习小结
收藏
1.强化学习认知
- 强化学习(Reinforcement Learning,简称RL),从领域上讲属于机器学习的一个分支。
- 强化学习架构
2.强化学习与监督学习
- 从学习的目的上讲,监督学习的目标是认知,而强化学习的目标是决策。若以股票价格为研究对象,监督学习的学习目标体现为对价格或趋势的预测和判断,相比之下,强化学习更加注重决策,也就是根据股票价格(environment)采取行动,如买入和卖出(action),从而获得收益或亏损(reward),并不断优化和调整买入和卖出决策。
- 强化学习和监督学习不是绝对的独立领域,在深度强化学习(DRL)中就会用到神经网络
3.强化学习经典算法
- Sarsa
- Q-learning
- DQN
- Policy-Gradient
- DDPG
1
收藏
请登录后评论
收货满满~~
加油!共同进步!