【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 37221 354
【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 37221 354

【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!


AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~

  • 筛选功能

  • 自定义标签

  • Markdown编辑器

数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview

有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~


活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末


奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~

https://ai.baidu.com/forum/topic/show/990477

数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。


活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。

小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。

 

数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。

 

3
收藏
回复
全部评论(354)
时间顺序
学习委员
#2 回复于2020-04

小编打样~

数据集名称:经典MNIST数据集(举例)

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/65(自己的数据集链接)

数据集简介:手写数字, 训练集数量60000, 测试集数量10000. 参考: http://yann.lecun.com/exdb/mnist/

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/31756

0
回复
thinc
#3 回复于2020-04

我们不是生产者,但我们是数据集的搬运工!

0
回复
学习委员
#4 回复于2020-04
thinc #3
我们不是生产者,但我们是数据集的搬运工!

求甩链接哈哈

0
回复
AIStudio810260
#5 回复于2020-04

数据集名称:钢材瑕疵检测

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/10941

数据集简介:钢材瑕疵点图像分割数据,训练集数量12568张,测试集数量1801张。参考https://www.kaggle.com/c/severstal-steel-defect-detection

来AI Studio互粉吧~等你哦~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149

1
回复
星光ld1
#6 回复于2020-04

数据集名称:5G

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/13055

数据集简介:

训练数据集一共包括了多个文件,每个文件代表一个小区内的数据。文件的命名方式为train_id.csv,其中id为小区的唯一标识,例如train_1003501.csv表示唯一标识为1003501的小区数据。

文件的每一行代表小区内固定大小的测试区域的相关数据,行数不定(根据小区大小不同,面积越大的小区行数越多,反之亦然),列数则固定为18列,其中前9列为站点的工程参数数据;中间8列为地图数据;最后1列是用于训练的RSRP标签数据。

具体可参考上述网页描述(https://baijiahao.baidu.com/s?id=1645227366801183696&wfr=spider&for=pc)

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76929

0
回复
星光ld1
#7 回复于2020-04

数据集名称:垃圾分类

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/32114

数据集简介:

分类包括四个一级类目:其他垃圾/厨余垃圾/可回收物/有害垃圾,以及40个二级类目:一次性快餐盒,污损塑料,烟蒂,牙签等(具体类目参考压缩文件的的json),总共涉及14683张图片,每张图片有对应的文本格式标注(Img_path label)书籍来源(https://developer.huaweicloud.com/hero/forum.php?mod=viewthread&tid=24106)

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76929

1
回复
thinc
#8 回复于2020-04

数据集名称:2019新型冠状病毒疫情时间序列数据仓库

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/32117

数据集简介:从2020/1/22到2020/4/23全球新冠确诊、死亡、治愈人数

来AI Studio互粉吧~等你哦~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/212554

 

0
回复
AIStudio810260
#9 回复于2020-04

数据集名称:铝型材表面瑕疵检测

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/10276

数据集简介:1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

来AI Studio互粉吧~等你哦~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149

0
回复
学习委员
#10 回复于2020-04

希望大家能生产(搬运)一些新的数据集哈~

1
回复
AIStudio810258
#11 回复于2020-04

数据集需要进行数据清洗处理还是,原味数据最好?

0
回复
学习委员
#12 回复于2020-04
数据集需要进行数据清洗处理还是,原味数据最好?

都可~~哈哈

0
回复
AIStudio810260
#13 回复于2020-04

数据集名称:连锁超市销量预估

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/17815

数据集简介:预测一家厄瓜多尔连锁超市数千种商品未来15天的每日销售额。参考:https://www.kaggle.com/c/favorita-grocery-sales-forecasting/data

来AI Studio互粉吧~等你哦~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149

0
回复
thinc
#14 回复于2020-04
数据集需要进行数据清洗处理还是,原味数据最好?

干净的数据肯定更好啦~

0
回复
春秋飞兔
#15 回复于2020-04

https://aistudio.baidu.com/aistudio/datasetdetail/26775

数据集名称:glint-asia (人脸识别数据集 IDs: 93979)

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/26775

数据集简介:人脸识别数据集 93,979 ids/2,830,146. 参考: http://trillionpairs.deepglint.com/overview

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/180299

0
回复
thinc
#16 回复于2020-04

昨天试了一下从数据集下载1G数据到本地,速度很快,少说也有20Mb/s,都不用丢给某雷了哈哈~~~大家赶紧行动起来啊!!!

1
回复
长夜星
#17 回复于2020-05
数据集名称:钢材瑕疵检测 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/10941 数据集简介:钢材瑕疵点图像分割数据,训练集数量12568张,测试集数量1801张。参考https://www.kaggle.com/c/severstal-steel-defect-detection 来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149
展开

让我想起了我的大学 冶金专业

0
回复
自尊心3
#20 回复于2020-05

数据集名称:RSNA肺炎检测数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/33509

数据集简介:北美放射学会(Radiological Society of North America)举办的kaggle肺炎检测挑战赛数据集https://www.kaggle.com/c/rsna-pneumonia-detection-challenge

数据集包含DICOM格式的肺部前后CT照片。标注部分包含了肺炎区域的边界框。  
其中包含了训练数据26684张,测试数据3000张。

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/218586

0
回复
自尊心3
#21 回复于2020-05
数据集名称:RSNA肺炎检测数据集 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/33509 数据集简介:北美放射学会(Radiological Society of North America)举办的kaggle肺炎检测挑战赛数据集https://www.kaggle.com/c/rsna-pneumonia-detection-challenge 数据集包含DICOM格式的肺部前后CT照片。标注部分包含了肺炎区域的边界框。   其中包含了训练数据26684张,测试数据3000张。 来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/218586
展开

前面两个标点符号有问题,版主麻烦删一下【流汗】

0
回复
学习委员
#22 回复于2020-05
前面两个标点符号有问题,版主麻烦删一下【流汗】

安排~~数据集很棒,多来一点哈哈啊

0
回复
thinc
#23 回复于2020-05

的机会来啦!!!

数据集名称:近20年的股票交易数据

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/33517

来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/212554

 

2
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户