ddpg训练时，target_actor(batch_s’)需要和choose_act一样处理吗?

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

我我在塘边哈发布于2022-10

比如，我在中choose_action函数对forward(state)取前四个输出，第五个输出置0，那么在训练时 target_actor(batch_next_s)，需要封装去前四个输出和第五个输出置0操作吗？还是不用管，直接forward()?

0

收藏

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~