数值型的预测，强化学习可以做吗，应该选择哪种模型呢

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

此此情可待505 发布于2021-07

输入是1*n的多字段数字，输出是一个指标r，奖惩是其中某几个字段数值增加加分，减少减分

全部评论(5)

JavaRoom

#2 回复于2021-07

可以的，所有的计算，都是一堆毫无感情的数字

三岁

#3 回复于2021-07

可以的，强化学习就是一种模式和学习方式，归根结底就是数学模型的转换与应用，不影响的

此

此情可待505

#4 回复于2021-07

JavaRoom #2

可以的，所有的计算，都是一堆毫无感情的数字

应该选择哪种模型呢，连续性数值预测，网上相关资料好少，基本都是gym游戏的

此

此情可待505

#5 回复于2021-07

三岁 #3

可以的，强化学习就是一种模式和学习方式，归根结底就是数学模型的转换与应用，不影响的

应该选择哪种模型呢，连续性数值预测，网上相关资料好少，基本都是gym游戏的，我用dqn可以直接在神经网络中转化吗，paddle的范例都是游戏。。。。

三岁

#6 回复于2021-07

此情可待505 #5

应该选择哪种模型呢，连续性数值预测，网上相关资料好少，基本都是gym游戏的，我用dqn可以直接在神经网络中转化吗，paddle的范例都是游戏。。。。

确实，强化学习基本上是用于游戏这类的“有自主意识”的进行设计的可以看一下DQN

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~