首页 Paddle框架 帖子详情
强化学习如何设计多维离散action
收藏
快速回复
Paddle框架 问答深度学习 344 1
强化学习如何设计多维离散action
收藏
快速回复
Paddle框架 问答深度学习 344 1

假设action的维度为3,A={a1,a2,a3}

a1的取值有0,1,2

a2的取值有0,1,2,3

a3的取值有0,1

请问如何设计网络的输出node?

0
收藏
回复
全部评论(1)
时间顺序
UnseenMe
#2 回复于2022-09

长度为9的OneHot肿么样,哈哈哈

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户