百度飞桨世界冠军带你从零实践强化学习总结
503718696 发布于2020-06 浏览:3546 回复:2
0
收藏

这一周学了什么

第一天,预习课程

了解了什么是深度学习
学习深度学需要什么数学知识,高等数学、线性代数、统计概率
安装PaddlePaddle以及初步了解
百度镜像系统中Notebook使用

第二天,强化学习

了解强化学习的概念以及应用

强化学习的核心知识

GYM、PARL

第三天,基于表格方法求解RL

基于数值的两种典型算法

Sarsa算法

QLearning算法

第四天,基于神经网络方法求解RL

基于深度学习网络算法

DQN网络

第五天,基于策略梯度求解RL

基于策略的典型算法Policy Gradient

第六天,连续动作空间上求解RL

DDPG(Deep Deterministic Policy Gradient)深度确定性策略梯度

DDPG扩展了DQN可以连续动作空间上求解

DDPG引入了表演评论机制

第七天 结训典礼

恭喜那些得奖大神们,成绩优秀非常

这一周碰到什么坑?

1.每次重启在线服务器的时候,安装的库包会自动还原,导致模型时好时坏,简直就是凭人品跑代码

解决方法:可以学习下库包永久安装在在线服务器上面方法

2.做大作业训练模型到6小时的时候停电20分钟,无法连接在线服务器,掉线导致所有训练结果一无所有

解决方法:设置在线服务器停止工作时间为2小时,默认10分钟

3.安装第三方包的时候,提示当前镜像网站连接失败,安装不鸟

解决方法:使用码云远程连接地址安装包

4.微信群不是很活跃,老师都挺忙的,学员问题都没人回答,不过群里还是有些非常热心的同学存在的,这里非常感谢这些人的帮助(叁岁,Solution ,何江,Mr.郑先生口

解决方法:自行百度摸索,不过最好百度AI能安排一个指导老师帮助最好了

5.平台赠送的算力卡是有时间周期限制的

解决办法:时间周期前把它用在训练模型的刀刃上

6.默认安装版本太高或者太低,导致代码跑不起来

解决办法:安装包的时候一定要指定版本号

总结:这一周初步了解强化学习了,获益良多。非常感谢百度平台的公开课,非常感谢老师们的辛苦备课,上课,阅卷。最后祝百度AI平台越办越好,越做越强,直至流行。

 

 

 

 

 

 

收藏
点赞
0
个赞
共2条回复 最后由常熟X小王182回复于2022-12
#3188******76回复于2020-08

赞一个!

0
#2付洋洋carrie回复于2020-06

0
TOP
切换版块