百度飞桨世界冠军带你从零实践强化学习总结

首页版块访问AI主站注册发帖

503718696 发布于2020-06 浏览:4111 回复:2

百度飞桨世界冠军带你从零实践强化学习总结

快速回复

这一周学了什么

第一天，预习课程

了解了什么是深度学习
学习深度学需要什么数学知识，高等数学、线性代数、统计概率
安装PaddlePaddle以及初步了解
百度镜像系统中Notebook使用

第二天，强化学习

了解强化学习的概念以及应用

强化学习的核心知识

GYM、PARL

第三天，基于表格方法求解RL

基于数值的两种典型算法

Sarsa算法

QLearning算法

第四天，基于神经网络方法求解RL

基于深度学习网络算法

DQN网络

第五天，基于策略梯度求解RL

基于策略的典型算法Policy Gradient

第六天，连续动作空间上求解RL

DDPG(Deep Deterministic Policy Gradient)深度确定性策略梯度

DDPG扩展了DQN可以连续动作空间上求解

DDPG引入了表演评论机制

第七天结训典礼

恭喜那些得奖大神们，成绩优秀非常

这一周碰到什么坑？

1.每次重启在线服务器的时候，安装的库包会自动还原，导致模型时好时坏，简直就是凭人品跑代码

解决方法：可以学习下库包永久安装在在线服务器上面方法

2.做大作业训练模型到6小时的时候停电20分钟，无法连接在线服务器，掉线导致所有训练结果一无所有

解决方法：设置在线服务器停止工作时间为2小时，默认10分钟

3.安装第三方包的时候，提示当前镜像网站连接失败，安装不鸟

解决方法：使用码云远程连接地址安装包

4.微信群不是很活跃，老师都挺忙的，学员问题都没人回答，不过群里还是有些非常热心的同学存在的，这里非常感谢这些人的帮助（叁岁，Solution ，何江，Mr.郑先生口
）

解决方法：自行百度摸索，不过最好百度AI能安排一个指导老师帮助最好了

5.平台赠送的算力卡是有时间周期限制的

解决办法：时间周期前把它用在训练模型的刀刃上

6.默认安装版本太高或者太低，导致代码跑不起来

解决办法：安装包的时候一定要指定版本号

总结：这一周初步了解强化学习了，获益良多。非常感谢百度平台的公开课，非常感谢老师们的辛苦备课，上课，阅卷。最后祝百度AI平台越办越好，越做越强，直至流行。

文档

技术问答

飞桨深度学习500问

个赞

共2条回复最后由常熟X小王182回复于2022-12

#3188******76回复于2020-08

赞一个！

#2付洋洋carrie回复于2020-06

快速回复

小编推荐

物体检测新手10问10答

付洋洋carrie 23回复

【评测免费送】EasyDL十目开发套件活动招募

付洋洋carrie 10回复

数据集智能标注功能

MercyShaw 22回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服