可以用别人公开的数据集文件拼新数据集么?
收藏
快速回复
AI Studio平台使用 问答数据集 744 18
可以用别人公开的数据集文件拼新数据集么?
收藏
快速回复
AI Studio平台使用 问答数据集 744 18

要用coco2017数据集里的部分文件,还需要自己补充部分数据文件。那么我可以“fork”别人的数据集在此基础上增删以适应不同的任务么?

0
收藏
回复
全部评论(18)
时间顺序
AIStudio810258
#2 回复于2021-04

或者有什么变通的方法,可以让我不用重新上传别人公开数据集里本来就有的那个18G的大文件,就能让新建立数据集里包含这个文件

0
回复
AIStudio810260
#3 回复于2021-04

这个要看数据集开源协议咋写的?

0
回复
AIStudio810260
#4 回复于2021-04

这个,是要重新训练模型嘛?那我觉得18G的大文件肯定得用上啊

0
回复
AIStudio810260
#5 回复于2021-04

如果是用预训练模型训练,是不是同样的效果?

0
回复
AIStudio810258
#6 回复于2021-04
这个要看数据集开源协议咋写的?

是coco2017数据集

0
回复
AIStudio810258
#7 回复于2021-04
这个,是要重新训练模型嘛?那我觉得18G的大文件肯定得用上啊

有一个官方比赛的数据集里有这个18g的大文件,但其它文件不全,因为不是用一种类型的模型

0
回复
AIStudio810258
#8 回复于2021-04
如果是用预训练模型训练,是不是同样的效果?

是论文复现那个活动,用预训练模型这个事儿。。。

0
回复
AIStudio810258
#9 回复于2021-04
这个,是要重新训练模型嘛?那我觉得18G的大文件肯定得用上啊

其实也有变通的方法,可以挂两个数据集么,把自己要用的上传到另一个数据集。然后项目从这两个数据集里分别摘文件用。。。

0
回复
AIStudio810258
#10 回复于2021-04

就是有点乱,觉得不舒服

0
回复
AIStudio810260
#11 回复于2021-04

我觉得18G数据集太大了,要用最好走脚本……可是脚本又抢不到卡

0
回复
AIStudio810258
#12 回复于2021-05
我觉得18G数据集太大了,要用最好走脚本……可是脚本又抢不到卡

现在脚本gpu这么难抢啊。。。

0
回复
AIStudio810260
#13 回复于2021-05
现在脚本gpu这么难抢啊。。。

资源少还是啥的……

0
回复
AIStudio810260
#14 回复于2021-05
现在脚本gpu这么难抢啊。。。

脚本也很容易被攻破

0
回复
wps
#15 回复于2021-05

建议问一下官方群里

0
回复
AIStudio810258
#16 回复于2021-05
脚本也很容易被攻破

过两天我想用下脚本多卡训练下

0
回复
AIStudio810258
#17 回复于2021-05
脚本也很容易被攻破

ai studio上有什么2.0的多卡训练demo么?

0
回复
AIStudio810258
#18 回复于2021-05
wps #15
建议问一下官方群里

说不定就什么时候“悄悄的更新了”~~

0
回复
AIStudio810258
#19 回复于2021-05
脚本也很容易被攻破

我看套件里主要就是分配了下数据的载荷,改下学习率,用分布式训练脚本启动训练脚本

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户