【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!
AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~
- 筛选功能
- 自定义标签
- Markdown编辑器
数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview
有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~
活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末。
奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~
https://ai.baidu.com/forum/topic/show/990477
数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。
活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。
小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
小编打样~
数据集名称:经典MNIST数据集(举例)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/65(自己的数据集链接)
数据集简介:手写数字, 训练集数量60000, 测试集数量10000. 参考: http://yann.lecun.com/exdb/mnist/
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/31756
我们不是生产者,但我们是数据集的搬运工!
求甩链接哈哈
数据集名称:钢材瑕疵检测
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/10941
数据集简介:钢材瑕疵点图像分割数据,训练集数量12568张,测试集数量1801张。参考https://www.kaggle.com/c/severstal-steel-defect-detection
来AI Studio互粉吧~等你哦~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149
数据集名称:5G
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/13055
数据集简介:
训练数据集一共包括了多个文件,每个文件代表一个小区内的数据。文件的命名方式为train_id.csv,其中id为小区的唯一标识,例如train_1003501.csv表示唯一标识为1003501的小区数据。
文件的每一行代表小区内固定大小的测试区域的相关数据,行数不定(根据小区大小不同,面积越大的小区行数越多,反之亦然),列数则固定为18列,其中前9列为站点的工程参数数据;中间8列为地图数据;最后1列是用于训练的RSRP标签数据。
具体可参考上述网页描述(https://baijiahao.baidu.com/s?id=1645227366801183696&wfr=spider&for=pc)
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76929
数据集名称:垃圾分类
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/32114
数据集简介:
分类包括四个一级类目:其他垃圾/厨余垃圾/可回收物/有害垃圾,以及40个二级类目:一次性快餐盒,污损塑料,烟蒂,牙签等(具体类目参考压缩文件的的json),总共涉及14683张图片,每张图片有对应的文本格式标注(Img_path label)书籍来源(https://developer.huaweicloud.com/hero/forum.php?mod=viewthread&tid=24106)
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/76929
数据集名称:2019新型冠状病毒疫情时间序列数据仓库
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/32117
数据集简介:从2020/1/22到2020/4/23全球新冠确诊、死亡、治愈人数
来AI Studio互粉吧~等你哦~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/212554
数据集名称:铝型材表面瑕疵检测
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/10276
数据集简介:1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。
来AI Studio互粉吧~等你哦~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149
希望大家能生产(搬运)一些新的数据集哈~
数据集需要进行数据清洗处理还是,原味数据最好?
都可~~哈哈
数据集名称:连锁超市销量预估
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/17815
数据集简介:预测一家厄瓜多尔连锁超市数千种商品未来15天的每日销售额。参考:https://www.kaggle.com/c/favorita-grocery-sales-forecasting/data
来AI Studio互粉吧~等你哦~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149
干净的数据肯定更好啦~
https://aistudio.baidu.com/aistudio/datasetdetail/26775
数据集名称:glint-asia (人脸识别数据集 IDs: 93979)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/26775
数据集简介:人脸识别数据集 93,979 ids/2,830,146. 参考: http://trillionpairs.deepglint.com/overview
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/180299
昨天试了一下从数据集下载1G数据到本地,速度很快,少说也有20Mb/s,都不用丢给某雷了哈哈~~~大家赶紧行动起来啊!!!
让我想起了我的大学 冶金专业
数据集名称:RSNA肺炎检测数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/33509
数据集简介:北美放射学会(Radiological Society of North America)举办的kaggle肺炎检测挑战赛数据集https://www.kaggle.com/c/rsna-pneumonia-detection-challenge
数据集包含DICOM格式的肺部前后CT照片。标注部分包含了肺炎区域的边界框。
其中包含了训练数据26684张,测试数据3000张。
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/218586
前面两个标点符号有问题,版主麻烦删一下【流汗】
安排~~数据集很棒,多来一点哈哈啊
发财的机会来啦!!!
数据集名称:近20年的股票交易数据
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/33517
来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/212554