强化学习七日打卡营学习小结

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

jindaweiok 发布于2020-06

1.强化学习认知

强化学习（Reinforcement Learning，简称RL），从领域上讲属于机器学习的一个分支。
强化学习架构

2.强化学习与监督学习

从学习的目的上讲，监督学习的目标是认知，而强化学习的目标是决策。若以股票价格为研究对象，监督学习的学习目标体现为对价格或趋势的预测和判断，相比之下，强化学习更加注重决策，也就是根据股票价格（environment）采取行动，如买入和卖出（action），从而获得收益或亏损（reward），并不断优化和调整买入和卖出决策。
强化学习和监督学习不是绝对的独立领域，在深度强化学习（DRL）中就会用到神经网络

3.强化学习经典算法

Sarsa
Q-learning
DQN
Policy-Gradient
DDPG

1

收藏

回复

全部评论(1)

AIStudio810258

#2 回复于2020-06

收货满满～～

加油！共同进步！

0

回复