【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!
AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~
- 筛选功能
- 自定义标签
- Markdown编辑器
数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview
有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~
活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末。
奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~
https://ai.baidu.com/forum/topic/show/990477
数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。
活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。
小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
数据集名称:4种小猫图片(猫脸识别)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/71418
数据集简介:4种小猫图片(猫脸识别),自己制作
这个数据集里找。或者需要啥我给你爬。。。
希望有一个优秀的股票预测数据集,实在没有我花时间做一个吧
数据集名称:鸽子数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/75217
数据集简介:原创数据集,用来做鸽子图像分割。
搬运数据集都限制数量大小吗
数据集名称:垃圾分类数据集ImageNet格式
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/77996
数据集简介:本数据集集华为云垃圾分类数据集、各垃圾分类公开数据集及网络爬虫等于一身,经机器、人工多重高质量清洗筛选整合而成。本数据拥有训练集:43685张;验证集:5363张;测试集:5363张;总类别数:158类。另外,本数据集格式为ImageNet格式,符合多数主流api接口。
建议增加一个数据集搜索的入口,要不然搬运过来的可能是已有的,就没啥意义了
数据集标题:LiTS28
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/79729
数据集简介:LiTS医疗图像分割是医学图像处理与分析领域中复杂且至关重要的一步,其目的是将医学图像中具有某些特殊含义的部分分割出来,并提取相关特征,为临床诊疗、医学数据的可视化以及病理学研究提供可靠的依据,辅助医生做出更为准确的诊断。
我在AI Studio上获得钻石等级,点亮7个徽章,来互粉呀~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/347967
大家快来搬运一些超级好玩使用的数据集把~
限制的,好像现在上限50G?
这个厉害了
可以补充一下数据列的详细说明
数据集名称:CAPTCHA Image dataset 验证码数据集
数据集链接: https://aistudio.baidu.com/aistudio/datasetdetail/84103
数据集简介:验证码数据,每个图像5个字符,图像有噪点, 包含数字,尺寸200*50 png,搬运自https://www.researchgate.net/publication/248380891_captcha_dataset
数据集名称:Heart Attack Analysis & Prediction Datas
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/84351
数据集简介:心脏病预测,数据各列如下所示
Age : Age of the patient
Sex : Sex of the patient
exang: exercise induced angina (1 = yes; 0 = no)
ca: number of major vessels (0-3)
cp : Chest Pain type chest pain type
Value 1: typical angina
Value 2: atypical angina
Value 3: non-anginal pain
Value 4: asymptomatic
trtbps : resting blood pressure (in mm Hg)
chol : cholestoral in mg/dl fetched via BMI sensor
fbs : (fasting blood sugar > 120 mg/dl) (1 = true; 0 = false)
rest_ecg : resting electrocardiographic results
Value 0: normal
Value 1: having ST-T wave abnormality (T wave inversions and/or ST elevation or depression of > 0.05 mV)
Value 2: showing probable or definite left ventricular hypertrophy by Estes' criteria
thalach : maximum heart rate achieved
target : 0= less chance of heart attack 1= more chance of heart attack
数据集名称:新鲜和过期红肉数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/84831
数据集简介:像素1280 x 720,共计 1896 张图片,每类, 948张。
数据集名称:House Price prediction 2021
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/84937
数据集简介:房价预测最新数据集,共计79个特征,1460列训练数据
数据集名称:睡眠脑电数据、P300脑机接口实验数据
数据集链接以及数据集详细阐释:https://aistudio.baidu.com/aistudio/datasetdetail/84937
https://aistudio.baidu.com/aistudio/projectdetail/1881057
数据集简介:1.提供了5个健康成年被试(S1-S5)的P300脑机接口实验数据,平均年龄为20岁。 2.提供3000个睡眠脑电特征样本及其标签,取自不同的健康成年人整夜睡眠过程。
具体内容见第二个链接详细阐释
数据集名称:近4年的工业汽油精制过程中的辛烷值数据
数据集链接以及数据集详细阐释:https://aistudio.baidu.com/aistudio/datasetdetail/85121
https://aistudio.baidu.com/aistudio/projectdetail/1881441
数据集简介:原始数据采集来自于中石化高桥石化实时数据库(霍尼韦尔PHD)及LIMS实验数据库。其中操作变量数据来自于实时数据库,采集时间为2017年4月至2020年5月,采集操作位点数共354个。2017年4月至2019年9月,数据采集频次为3分钟/次;2019年10月至2020年5月,数据采集频次为6分钟/次。原料、产品和催化剂数据来自于LIMS实验数据库,数据时间范围为2017年4月至2020年5月。其中原料及产品的辛烷值是重要的建模变量,该数据采集频次为每周2次。
具体内容见第二个链接详细阐释
数据集名称:7种石头分类数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/85829
数据集简介:石头分类数据集
图像分类数据集:
CIFAR-10(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85768
CIFAR-100(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85769
细粒度图像分类数据集:
FGVC Aircraft(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85757
CUB-200-2011(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85759
Stanford Cars(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85765