强化学习可以理解成人工提供梯度么？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

AIStudio810258 发布于2020-12

突然想到这个问题。

0

收藏

回复

全部评论(4)

AIStudio810258

#2 回复于2020-12

既然梯度下降是为了缩小搜索空间的范围。那么”学习经验“的强化学习，可以理解为人工提供”梯度“么

0

回复

AIStudio810258

#3 回复于2020-12

或者说，我们找到了偏导数做神经网络优化的依据。而强化学习，我们没找到像偏导数这么有效的依据，就靠经验了

0

回复

AIStudio810258

#4 回复于2020-12

打个比方，神经网络的学习方法就像我们教小孩子学数学，公式都已经推导出来了，我们直接照着”清晰的规律“教。而强化学习就像教一些人文学科比如文学，理论不是那么清晰，我们就直接教作品，让学生自己学。多看大师的作品一样能提高水平

0

回复

AIStudio810258

#5 回复于2020-12

可以这么理解么？

0

回复