数值型的预测,强化学习可以做吗,应该选择哪种模型呢
收藏
输入是1*n的多字段数字,输出是一个指标r,奖惩是其中某几个字段数值增加 加分,减少减分
0
收藏
请登录后评论
可以的,所有的计算,都是一堆毫无感情的数字
可以的,强化学习就是一种模式和学习方式,归根结底就是数学模型的转换与应用,不影响的
应该选择哪种模型呢,连续性数值预测,网上相关资料好少,基本都是gym游戏的
应该选择哪种模型呢,连续性数值预测,网上相关资料好少,基本都是gym游戏的,我用dqn可以直接在神经网络中转化吗,paddle的范例都是游戏。。。。
确实,强化学习基本上是用于游戏这类的“有自主意识”的进行设计的可以看一下DQN