强化学习7日打卡营-世界冠军带你从零实践学习心得

首页版块访问AI主站注册发帖

飞龙学涯发布于2020-06 浏览:1657 回复:0

快速回复

课节1：预习课程。该部分内容充实，非常适合零基础同学入门，而且该部分内容图文搭配、详实得当，最给力的是第三课-Python快速入门给出了许多代码实例，让学习者对知识的理解和代码实践均有较大的收获。PaddlePaddle快速入门知识简单、易懂，只是感觉该部分知识少了一丢丢，本来特别想学习这部分的知识，可惜该部分知识没像其他平台如：Pytorch、Keras那样层次性的展列，当然仅是个人感觉。 AI Studio基本操作-做的很棒，如同本地般conda-notebook操作，只是离线后会断掉。重新开启环境时，进入页面后会提示项目运行中，但看不到运行进度，这点有点困惑。
课节2：强化学习（RL）初印象，这是我听的最认真的一次课，内容特别棒，6个部分的内容，层层递进，加之科科老师很用心的讲解，非常受益，课后作业安排很合理。
课节3：表格型方法Sarsa和Q-learning，科科老师讲解的很不错，分析两者的区别以及优缺点，剖析到位，对于刚入门的我，对On-Policy与Off-Policy的理解仍需努力。
课节4：神经网络方法求解RL，科科老师对DQN的讲解到位，特别分析了该算法的两大亮点：经验回放、固定Q目标，同时对神经网络的分析到位，对DQN和神经网络的知识学习均受益颇多。
课节5：策略梯度方法求解RL，老师对这部分内容的讲解很好，基于值和基于策略的分析到位，但对策略梯度的理解和用于策略网络优化等方面的知识还需加强。
课节6：连续动作空间上求解RL，科科老师对DDPG算法分析不错，不仅区分了离散动作和连续动作知识，还对评论家-演员框架进行了讲解，代码解析到位，收获颇多的一次课节。
总体感觉课程设计非常不错，内容层层递进，从课前知识——》概念——》算法——》神经网络——》连续动作空间，知识一环扣一环，非常适合初学者入门。而个人感到遗憾的是没有充分保障学习时间，因为其他杂事耽误了课程内容的学习，后期定会跟进学习，同时补充AI Studio平台其他课程的学习，更加熟悉PaddlePaddle环境。

热门活动

个赞

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服