有人用强化学习的方法搜索模型空间么？

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

AIStudio810258 发布于2020-12

整个搜索空间太大，只能人工设计。那么数据、经验、算力足够多了的情况下，可以用强化学习的方法搜索模型空间么？

全部评论(157)

AIStudio810260

#102 回复于2021-01

AIStudio810258 #98

就是这个意思～～最后模型还是跟人学。但是，也有强化学习左右互搏完虐人类的例子，真让人纠结。。。

这个场景还是比较局限的吧，我们应该庆幸强化学习还没那么全能

AIStudio810260

#103 回复于2021-01

thinc #101

强化学习真的太刁了

烧钱啊……

AIStudio810260

#104 回复于2021-01

AIStudio810258 #99

嗯，懂了！！！模型是避免重复标注的。已经训练过的分类就不用人去标注了，只需增量标注新类别～～～～～～～～～～～

不是啊，不是这个意思……

AIStudio810260

#105 回复于2021-01

AIStudio810258 #99

嗯，懂了！！！模型是避免重复标注的。已经训练过的分类就不用人去标注了，只需增量标注新类别～～～～～～～～～～～

我理解啊，训练集的少量标注就不用标了（训练过程中发现标注错误的除外），测试集的拿去预测一番

AIStudio810260

#106 回复于2021-01

AIStudio810260 #105

我理解啊，训练集的少量标注就不用标了（训练过程中发现标注错误的除外），测试集的拿去预测一番

预测结果要人工微调，这样可以降低从0开始的优化量

AIStudio810258

#107 回复于2021-01

thinc #100

现在的还是以“人肉标注”为主

我们这么卖力气的教机器，真不知会不会教出个终结者来，就是教出个审判者来也不好受啊～～

AIStudio810258

#108 回复于2021-01

thinc #101

强化学习真的太刁了

我最佩服强化学习：没有梯度，制造梯度，也要下降梯度～

AIStudio810258

#109 回复于2021-01

AIStudio810260 #102

这个场景还是比较局限的吧，我们应该庆幸强化学习还没那么全能

这还是没把ai当自己人啊～～

AIStudio810258

#110 回复于2021-01

AIStudio810260 #104

不是啊，不是这个意思……

（捂脸喷泪儿）白开心了。。。

是指用半监督学习方法么？

AIStudio810258

#111 回复于2021-01

AIStudio810260 #106

预测结果要人工微调，这样可以降低从0开始的优化量

就是说，人工标注可以先有个大概没那么准确的“预标注”

AIStudio810260

#112 回复于2021-01

AIStudio810258 #108

我最佩服强化学习：没有梯度，制造梯度，也要下降梯度～

可是强化学习烧算力呀

AIStudio810260

#113 回复于2021-01

AIStudio810258 #107

我们这么卖力气的教机器，真不知会不会教出个终结者来，就是教出个审判者来也不好受啊～～

现在还是弱人工智能啊……（是这个词吧？）

AIStudio810260

#114 回复于2021-01

AIStudio810258 #111

就是说，人工标注可以先有个大概没那么准确的“预标注”

准确肯定是有，就是成本太大了，像素级标注呢

AIStudio810260

#115 回复于2021-01

AIStudio810258 #111

就是说，人工标注可以先有个大概没那么准确的“预标注”

我自己用安全帽检测数据集的时候就想，哟，我来标那得猴年马月

AIStudio810258

#116 回复于2021-01

AIStudio810260 #112

可是强化学习烧算力呀

虽不太懂，但我觉得用强化学习的一个原因就是没有直接解决问题的梯度

AIStudio810258

#117 回复于2021-01

AIStudio810260 #113

现在还是弱人工智能啊……（是这个词吧？）

反正不是“人工弱智·能”～～

AIStudio810258

#118 回复于2021-01

AIStudio810260 #113

现在还是弱人工智能啊……（是这个词吧？）

朦胧觉得是指“感知”的人工智能吧，能进行“认知”就是强人工智能了吧，有超人工智能么～

AIStudio810260

#119 回复于2021-01

AIStudio810258 #116

虽不太懂，但我觉得用强化学习的一个原因就是没有直接解决问题的梯度

不是吧，我觉得是算力和场景问题

AIStudio810260

#120 回复于2021-01

AIStudio810258 #116

虽不太懂，但我觉得用强化学习的一个原因就是没有直接解决问题的梯度

目前除了游戏场景外，强化学习怎么训练是个比较大的问题。尝试—失败，尝试—失败……能够承受这种做法的商业场景非常少的

AIStudio810260

#121 回复于2021-01

AIStudio810260 #120

目前除了游戏场景外，强化学习怎么训练是个比较大的问题。尝试—失败，尝试—失败……能够承受这种做法的商业场景非常少的

另一方面，一些场景用专家系统就行了，虽然强化学习很美好，但是专家系统稳定啊，不会暴走啊