首页 炼丹房 帖子详情
强化学习可以理解成人工提供梯度么?
收藏
快速回复
炼丹房 问答头脑风暴 1200 4
强化学习可以理解成人工提供梯度么?
收藏
快速回复
炼丹房 问答头脑风暴 1200 4

突然想到这个问题。

0
收藏
回复
全部评论(4)
时间顺序
AIStudio810258
#2 回复于2020-12

既然梯度下降是为了缩小搜索空间的范围。那么”学习经验“的强化学习,可以理解为人工提供”梯度“么

0
回复
AIStudio810258
#3 回复于2020-12

或者说,我们找到了偏导数做神经网络优化的依据。而强化学习,我们没找到像偏导数这么有效的依据,就靠经验了

0
回复
AIStudio810258
#4 回复于2020-12

打个比方,神经网络的学习方法就像我们教小孩子学数学,公式都已经推导出来了,我们直接照着”清晰的规律“教。而强化学习就像教一些人文学科比如文学,理论不是那么清晰,我们就直接教作品,让学生自己学。多看大师的作品一样能提高水平

0
回复
AIStudio810258
#5 回复于2020-12

可以这么理解么?

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户