可以用别人公开的数据集文件拼新数据集么?
收藏
要用coco2017数据集里的部分文件,还需要自己补充部分数据文件。那么我可以“fork”别人的数据集在此基础上增删以适应不同的任务么?
0
收藏
请登录后评论
或者有什么变通的方法,可以让我不用重新上传别人公开数据集里本来就有的那个18G的大文件,就能让新建立数据集里包含这个文件
这个要看数据集开源协议咋写的?
这个,是要重新训练模型嘛?那我觉得18G的大文件肯定得用上啊
如果是用预训练模型训练,是不是同样的效果?
是coco2017数据集
有一个官方比赛的数据集里有这个18g的大文件,但其它文件不全,因为不是用一种类型的模型
是论文复现那个活动,用预训练模型这个事儿。。。
其实也有变通的方法,可以挂两个数据集么,把自己要用的上传到另一个数据集。然后项目从这两个数据集里分别摘文件用。。。
就是有点乱,觉得不舒服
我觉得18G数据集太大了,要用最好走脚本……可是脚本又抢不到卡
现在脚本gpu这么难抢啊。。。
资源少还是啥的……
脚本也很容易被攻破
建议问一下官方群里
过两天我想用下脚本多卡训练下
ai studio上有什么2.0的多卡训练demo么?
说不定就什么时候“悄悄的更新了”~~
我看套件里主要就是分配了下数据的载荷,改下学习率,用分布式训练脚本启动训练脚本