【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 77872 354
【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 77872 354

【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!


AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~

  • 筛选功能

  • 自定义标签

  • Markdown编辑器

数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview

有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~


活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末


奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~

https://ai.baidu.com/forum/topic/show/990477

数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。


活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。

小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。

 

数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。

 

3
收藏
回复
全部评论(354)
时间顺序
AIStudio810259
#265 回复于2021-02

数据集名称:4种小猫图片(猫脸识别)

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/71418

数据集简介:4种小猫图片(猫脸识别),自己制作

0
回复
AIStudio810259
#266 回复于2021-02
哈哈,来看看有没有关于有标签的评论数据,比如淘宝、京东、亚马逊等评论数据,研究这些评论是否是真实评论,或者虚假的刷单评论。

这个数据集里找。或者需要啥我给你爬。。。

0
回复
dragonli0918
#267 回复于2021-03

希望有一个优秀的股票预测数据集,实在没有我花时间做一个吧

0
回复
nanting03
#268 回复于2021-03

数据集名称:鸽子数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/75217

数据集简介:原创数据集,用来做鸽子图像分割。

0
回复
潜沉10
#269 回复于2021-03

搬运数据集都限制数量大小吗

0
回复
Thomas-yanxin
#270 回复于2021-03

数据集名称:垃圾分类数据集ImageNet格式
 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/77996

数据集简介:本数据集集华为云垃圾分类数据集、各垃圾分类公开数据集及网络爬虫等于一身,经机器、人工多重高质量清洗筛选整合而成。本数据拥有训练集:43685张;验证集:5363张;测试集:5363张;总类别数:158类。另外,本数据集格式为ImageNet格式,符合多数主流api接口。

1
回复
脆皮肉饼
#271 回复于2021-04

建议增加一个数据集搜索的入口,要不然搬运过来的可能是已有的,就没啥意义了

0
回复
行远见大
#272 回复于2021-04

数据集标题:LiTS28

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/79729

数据集简介:LiTS医疗图像分割是医学图像处理与分析领域中复杂且至关重要的一步,其目的是将医学图像中具有某些特殊含义的部分分割出来,并提取相关特征,为临床诊疗、医学数据的可视化以及病理学研究提供可靠的依据,辅助医生做出更为准确的诊断。

我在AI Studio上获得钻石等级,点亮7个徽章,来互粉呀~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/347967

0
回复
学习委员
#273 回复于2021-04

大家快来搬运一些超级好玩使用的数据集把~

0
回复
AIStudio810260
#274 回复于2021-04
潜沉10 #269
搬运数据集都限制数量大小吗

限制的,好像现在上限50G?

0
回复
AIStudio810261
#275 回复于2021-04
数据集名称:一见钟情数据集 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/52008 数据集简介: >一见钟情学习赛,受到哥伦布亚商学院教授Ray Fisman和Sheena Iyengar联合发布的文章《伴侣选择中的性别差异(Gender Differences in Mate Selection: Evidence From a Speed Dating Experiment)》启发,决定利用机器学习的数据实验来分析当下男女在相亲交友时,个人的内在外在各类因素对最终相亲结果的影响。 >在2002年-2004年期间,Ray Fisman教授和Sheena Iyengar教授在筹备论文时,邀请志愿者参加闪电速配实验(相亲车轮战,每4分钟与一名相亲对象快速沟通,然后再换下一个相亲对象),提供一些相关的个人信息给相亲对象,并询问相亲对象给出是否愿意在不久的未来再次见面。本次学习赛的分析数据,记录了当时一见钟情相亲实验时,志愿者的相关信息及相亲结果。 >数据集的内容包括实验志愿者的性别、年龄、人种、专业、地区、收入等特征,以及志愿者对配偶是否来自同一地区、同一信仰等观点的预期。  
展开

这个厉害了

 

0
回复
AIStudio810261
#276 回复于2021-04
thinc #108
数据集名称:携程房型产品用户行为 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/39243 数据集简介:数据主要包含以下几个部分:用户数据、酒店数据、房型数据。大家可以根据在用户的历史信息,挖掘出用户对于某些房型偏好。 来AI Studio粉我吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/212554
展开

可以补充一下数据列的详细说明

0
回复
AIStudio810259
#277 回复于2021-04

数据集名称:CAPTCHA Image dataset 验证码数据集

数据集链接: https://aistudio.baidu.com/aistudio/datasetdetail/84103

数据集简介:验证码数据,每个图像5个字符,图像有噪点, 包含数字,尺寸200*50 png,搬运自https://www.researchgate.net/publication/248380891_captcha_dataset

0
回复
AIStudio810259
#278 回复于2021-04

 

数据集名称:Heart Attack Analysis & Prediction Datas
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/84351
数据集简介:心脏病预测,数据各列如下所示
Age : Age of the patient
Sex : Sex of the patient
exang: exercise induced angina (1 = yes; 0 = no)
ca: number of major vessels (0-3)
cp : Chest Pain type chest pain type
Value 1: typical angina
Value 2: atypical angina
Value 3: non-anginal pain
Value 4: asymptomatic
trtbps : resting blood pressure (in mm Hg)
chol : cholestoral in mg/dl fetched via BMI sensor
fbs : (fasting blood sugar > 120 mg/dl) (1 = true; 0 = false)
rest_ecg : resting electrocardiographic results
Value 0: normal
Value 1: having ST-T wave abnormality (T wave inversions and/or ST elevation or depression of > 0.05 mV)
Value 2: showing probable or definite left ventricular hypertrophy by Estes' criteria
thalach : maximum heart rate achieved
target : 0= less chance of heart attack 1= more chance of heart attack

0
回复
AIStudio810259
#279 回复于2021-04

数据集名称:新鲜和过期红肉数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/84831

数据集简介:像素1280 x 720,共计 1896 张图片,每类, 948张。

0
回复
AIStudio810259
#280 回复于2021-04

数据集名称:House Price prediction 2021

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/84937

数据集简介:房价预测最新数据集,共计79个特征,1460列训练数据

0
回复
#281 回复于2021-04

数据集名称:睡眠脑电数据、P300脑机接口实验数据

数据集链接以及数据集详细阐释:https://aistudio.baidu.com/aistudio/datasetdetail/84937

                                                  https://aistudio.baidu.com/aistudio/projectdetail/1881057

数据集简介:1.提供了5个健康成年被试(S1-S5)的P300脑机接口实验数据,平均年龄为20岁。 2.提供3000个睡眠脑电特征样本及其标签,取自不同的健康成年人整夜睡眠过程。

具体内容见第二个链接详细阐释

0
回复
#282 回复于2021-04

数据集名称:近4年的工业汽油精制过程中的辛烷值数据

数据集链接以及数据集详细阐释:https://aistudio.baidu.com/aistudio/datasetdetail/85121

https://aistudio.baidu.com/aistudio/projectdetail/1881441                                               

数据集简介:原始数据采集来自于中石化高桥石化实时数据库(霍尼韦尔PHD)及LIMS实验数据库。其中操作变量数据来自于实时数据库,采集时间为2017年4月至2020年5月,采集操作位点数共354个。2017年4月至2019年9月,数据采集频次为3分钟/次;2019年10月至2020年5月,数据采集频次为6分钟/次。原料、产品和催化剂数据来自于LIMS实验数据库,数据时间范围为2017年4月至2020年5月。其中原料及产品的辛烷值是重要的建模变量,该数据采集频次为每周2次。

具体内容见第二个链接详细阐释

0
回复
AIStudio810259
#283 回复于2021-05

数据集名称:7种石头分类数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/85829

数据集简介:石头分类数据集

 

0
回复
一卓
#284 回复于2021-05

图像分类数据集:

CIFAR-10(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85768

CIFAR-100(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85769

 

细粒度图像分类数据集:

FGVC Aircraft(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85757

CUB-200-2011(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85759

Stanford Cars(按类别文件夹存放):https://aistudio.baidu.com/aistudio/datasetdetail/85765

 

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户