首页 炼丹房 帖子详情
有人用强化学习的方法搜索模型空间么?
收藏
快速回复
炼丹房 问答新手上路头脑风暴 5294 157
有人用强化学习的方法搜索模型空间么?
收藏
快速回复
炼丹房 问答新手上路头脑风暴 5294 157

整个搜索空间太大,只能人工设计。那么数据、经验、算力足够多了的情况下,可以用强化学习的方法搜索模型空间么?

0
收藏
回复
全部评论(157)
时间顺序
AIStudio810260
#102 回复于2021-01
就是这个意思~~最后模型还是跟人学。 但是,也有强化学习左右互搏完虐人类的例子,真让人纠结。。。

这个场景还是比较局限的吧,我们应该庆幸强化学习还没那么全能

0
回复
AIStudio810260
#103 回复于2021-01
thinc #101
强化学习真的太刁了

烧钱啊……

0
回复
AIStudio810260
#104 回复于2021-01
嗯,懂了!!! 模型是避免重复标注的。已经训练过的分类就不用人去标注了,只需增量标注新类别~~~~~~~~~~~

不是啊,不是这个意思……

0
回复
AIStudio810260
#105 回复于2021-01
嗯,懂了!!! 模型是避免重复标注的。已经训练过的分类就不用人去标注了,只需增量标注新类别~~~~~~~~~~~

我理解啊,训练集的少量标注就不用标了(训练过程中发现标注错误的除外),测试集的拿去预测一番

0
回复
AIStudio810260
#106 回复于2021-01
我理解啊,训练集的少量标注就不用标了(训练过程中发现标注错误的除外),测试集的拿去预测一番

预测结果要人工微调,这样可以降低从0开始的优化量

0
回复
AIStudio810258
#107 回复于2021-01
thinc #100
现在的还是以“人肉标注”为主

我们这么卖力气的教机器,真不知会不会教出个终结者来,就是教出个审判者来也不好受啊~~

0
回复
AIStudio810258
#108 回复于2021-01
thinc #101
强化学习真的太刁了

我最佩服强化学习:没有梯度,制造梯度,也要下降梯度~

0
回复
AIStudio810258
#109 回复于2021-01
这个场景还是比较局限的吧,我们应该庆幸强化学习还没那么全能

这还是没把ai当自己人啊~~

0
回复
AIStudio810258
#110 回复于2021-01
不是啊,不是这个意思……

(捂脸喷泪儿)白开心了。。。

是指用半监督学习方法么?

0
回复
AIStudio810258
#111 回复于2021-01
预测结果要人工微调,这样可以降低从0开始的优化量

就是说,人工标注可以先有个大概没那么准确的“预标注”

0
回复
AIStudio810260
#112 回复于2021-01
我最佩服强化学习:没有梯度,制造梯度,也要下降梯度~

可是强化学习烧算力呀

0
回复
AIStudio810260
#113 回复于2021-01
我们这么卖力气的教机器,真不知会不会教出个终结者来,就是教出个审判者来也不好受啊~~

现在还是弱人工智能啊……(是这个词吧?)

0
回复
AIStudio810260
#114 回复于2021-01
就是说,人工标注可以先有个大概没那么准确的“预标注”

准确肯定是有,就是成本太大了,像素级标注呢

0
回复
AIStudio810260
#115 回复于2021-01
就是说,人工标注可以先有个大概没那么准确的“预标注”

我自己用安全帽检测数据集的时候就想,哟,我来标那得猴年马月

0
回复
AIStudio810258
#116 回复于2021-01
可是强化学习烧算力呀

虽不太懂,但我觉得用强化学习的一个原因就是没有直接解决问题的梯度

0
回复
AIStudio810258
#117 回复于2021-01
现在还是弱人工智能啊……(是这个词吧?)

反正不是“人工弱智·能”~~

0
回复
AIStudio810258
#118 回复于2021-01
现在还是弱人工智能啊……(是这个词吧?)

朦胧觉得是指“感知”的人工智能吧,能进行“认知”就是强人工智能了吧,有超人工智能么~

0
回复
AIStudio810260
#119 回复于2021-01
虽不太懂,但我觉得用强化学习的一个原因就是没有直接解决问题的梯度

不是吧,我觉得是算力和场景问题

0
回复
AIStudio810260
#120 回复于2021-01
虽不太懂,但我觉得用强化学习的一个原因就是没有直接解决问题的梯度

目前除了游戏场景外,强化学习怎么训练是个比较大的问题。尝试—失败,尝试—失败……能够承受这种做法的商业场景非常少的

0
回复
AIStudio810260
#121 回复于2021-01
目前除了游戏场景外,强化学习怎么训练是个比较大的问题。尝试—失败,尝试—失败……能够承受这种做法的商业场景非常少的

另一方面,一些场景用专家系统就行了,虽然强化学习很美好,但是专家系统稳定啊,不会暴走啊

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户