强化学习中的ddpg网络输出维度可以根据输入可以动态变化吗？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

我我在塘边哈发布于2022-03

正常ddpg网络的一开始的输出维度就固定了，如何设计动态的，或者固定，如何达到我下面的需求？

比如 ddpg网络输入

当state=【6】，输出层经过softmax=【0.1，0.2，0.1，0.1，0.25，0.1，0.1】

当state=【3】，输出层经过softmax=【0.5，0.3，0.2】

当state=【4】，输出层进过softmax= 【0.2，0.3，0.3，0.2】

0

收藏

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~