首页 AI Studio教育版 帖子详情
强化学习七日打卡营学习小结
收藏
快速回复
AI Studio教育版 文章课程答疑 828 1
强化学习七日打卡营学习小结
收藏
快速回复
AI Studio教育版 文章课程答疑 828 1

1.强化学习认知

  • 强化学习(Reinforcement Learning,简称RL),从领域上讲属于机器学习的一个分支。
  • 强化学习架构

2.强化学习与监督学习

  •   从学习的目的上讲,监督学习的目标是认知,而强化学习的目标是决策。若以股票价格为研究对象,监督学习的学习目标体现为对价格或趋势的预测和判断,相比之下,强化学习更加注重决策,也就是根据股票价格(environment)采取行动,如买入和卖出(action),从而获得收益或亏损(reward),并不断优化和调整买入和卖出决策。
  • 强化学习和监督学习不是绝对的独立领域,在深度强化学习(DRL)中就会用到神经网络

3.强化学习经典算法

  • Sarsa
  • Q-learning
  • DQN
  • Policy-Gradient
  • DDPG
1
收藏
回复
全部评论(1)
时间顺序
AIStudio810258
#2 回复于2020-06

收货满满~~

加油!共同进步!

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户