【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 77539 354
【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 77539 354

【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!


AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~

  • 筛选功能

  • 自定义标签

  • Markdown编辑器

数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview

有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~


活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末


奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~

https://ai.baidu.com/forum/topic/show/990477

数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。


活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。

小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。

 

数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。

 

3
收藏
回复
全部评论(354)
时间顺序
乌拉__----
#185 回复于2020-08

数据集名称:FaceForensics++数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/49510

数据集简介:论文《Few-shot video to video synthesis》FaceForensics++数据集包含977个脸部说话视频 以及 json, 由于数据集过大,分为了5个压缩包。

来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/311241

0
回复
thinc
#186 回复于2020-08
数据集名称:FaceForensics++数据集 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/49510 数据集简介:论文《Few-shot video to video synthesis》FaceForensics++数据集包含977个脸部说话视频 以及 json, 由于数据集过大,分为了5个压缩包。 来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/311241
展开

现在数据集更新了,最大能放50G

0
回复
乌拉__----
#187 回复于2020-08
thinc #186
现在数据集更新了,最大能放50G

还好,上传的时候上限100g,数据集有36g

0
回复
学习委员
#188 回复于2020-08

公开数据集不占用50个的上限限制了哈~

0
回复
aaaaaa
#189 回复于2020-08

又可以愉快的搬运数据集了

0
回复
AIStudio810259
#190 回复于2020-08

数据集名称:红酒数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/42042

数据集简介:红酒数据集 这个数据集有1599个样本,11个红酒的理化性质,以及红酒的品质(评分从0到10)

0
回复
thinc
#191 回复于2020-08

奥里给!我先冲了,兄弟萌

0
回复
AIStudio810259
#192 回复于2020-08

数据集名称:银行存款数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/51950

数据集简介:银行存款数据集 预测分析 根据客户特征(年龄、工作类型、婚姻状况、文化程度、是否有房贷和是否有个人贷款),预测客户是否愿意办理定期存款业务。

表1 数据源的具体字段及意义

字段名

含义

类型

描述

attr_1

年龄

Int

表示客户的年龄。

attr_2

职业

String

表示客户所从事的职业。

attr_3

婚姻情况

String

表示客户是否结婚或已离异。

attr_4

教育情况

String

表示客户受教育的程度。

attr_5

房产情况

String

表示客户名下是否有房产。

attr_6

贷款情况

String

表示客户名下是否有贷款。

attr_7

存款情况

String

表示客户名下是否有存款。

0
回复
AIStudio810259
#193 回复于2020-08
数据集名称:银行存款数据集 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/51950 数据集简介:银行存款数据集 预测分析 根据客户特征(年龄、工作类型、婚姻状况、文化程度、是否有房贷和是否有个人贷款),预测客户是否愿意办理定期存款业务。 表1 数据源的具体字段及意义 字段名 含义 类型 描述 attr_1 年龄 Int 表示客户的年龄。 attr_2 职业 String 表示客户所从事的职业。 attr_3 婚姻情况 String 表示客户是否结婚或已离异。 attr_4 教育情况 String 表示客户受教育的程度。 attr_5 房产情况 String 表示客户名下是否有房产。 attr_6 贷款情况 String 表示客户名下是否有贷款。 attr_7 存款情况 String 表示客户名下是否有存款。
展开

表2 数据集样本数据

attr_1

attr_2

attr_3

attr_4

attr_5

attr_6

attr_7

31

blue-collar

married

secondary

yes

no

no

41

management

married

tertiary

yes

yes

no

38

technician

single

secondary

yes

no

no

39

technician

single

secondary

yes

no

yes

39

blue-collar

married

secondary

yes

no

no

39

services

single

unknown

yes

no

no

0
回复
AIStudio810259
#194 回复于2020-08

数据集名称:一见钟情数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/52008

数据集简介:

>一见钟情学习赛,受到哥伦布亚商学院教授Ray Fisman和Sheena Iyengar联合发布的文章《伴侣选择中的性别差异(Gender Differences in Mate Selection: Evidence From a Speed Dating Experiment)》启发,决定利用机器学习的数据实验来分析当下男女在相亲交友时,个人的内在外在各类因素对最终相亲结果的影响。

>在2002年-2004年期间,Ray Fisman教授和Sheena Iyengar教授在筹备论文时,邀请志愿者参加闪电速配实验(相亲车轮战,每4分钟与一名相亲对象快速沟通,然后再换下一个相亲对象),提供一些相关的个人信息给相亲对象,并询问相亲对象给出是否愿意在不久的未来再次见面。本次学习赛的分析数据,记录了当时一见钟情相亲实验时,志愿者的相关信息及相亲结果。

>数据集的内容包括实验志愿者的性别、年龄、人种、专业、地区、收入等特征,以及志愿者对配偶是否来自同一地区、同一信仰等观点的预期。

 

0
回复
thinc
#195 回复于2020-09
表2 数据集样本数据 attr_1 attr_2 attr_3 attr_4 attr_5 attr_6 attr_7 31 blue-collar married secondary yes no no 41 management married tertiary yes yes no 38 technician single secondary yes no no 39 technician single secondary yes no yes 39 blue-collar married secondary yes no no 39 services single unknown yes no no
展开

有心了哈哈哈

0
回复
AIStudio810259
#196 回复于2020-09
thinc #195
有心了哈哈哈

继续搬运

0
回复
AIStudio810259
#197 回复于2020-09

数据集名称:冰山数据集Iceberg-Data-Set

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/5206

数据集简介:冰山图像分类任务,实验所使用的图像为雷达图像,需要参赛者利用算法识别出图像中是冰山(iceberg)还是船(ship)。

0
回复
trainer
#198 回复于2020-09

数据标题:遥感影像-场景分类 深度学习数据集汇总

数据链接:https://aistudio.baidu.com/aistudio/projectdetail/882508

数据简介:遥感影像-场景分类 深度学习数据集汇总

0
回复
AIStudio810259
#199 回复于2020-09

数据标题:精灵宝可梦数据集pokemon0820

数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/53877

数据简介:本数据涵盖了从第一代到第七代共801只宝可梦小精灵的信息。数据特征上包含了基础的能力值,对于其他属性的克制能力,身高,体重,种类等等。数据来源为 http://serebii.net/

0
回复
AIStudio810259
#200 回复于2020-09

数据标题:快来一起挖掘幸福感

数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/53880

数据简介:考虑到变量个数较多,部分变量间关系复杂,数据分为完整版和精简版两类。可从精简版入手熟悉赛题后,使用完整版挖掘更多信息。complete文件为变量完整版数据,abbr文件为变量精简版数据。
index文件中包含每个变量对应的问卷题目,以及变量取值的含义。
survey文件是数据源的原版问卷,作为补充以方便理解问题背景。
数据来源:赛题使用的数据来自中国人民大学中国调查与数据中心主持之《中国综合社会调查(CGSS)》项目。赛题感谢此机构及其人员提供数据协助。中国综合社会调查为多阶分层抽样的截面面访调查。

0
回复
AIStudio810259
#201 回复于2020-09

数据标题:快来一起挖掘幸福感

数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/53883

数据简介:新浪微博作为中国最大的社交媒体平台,旨在帮助用户发布的公开内容提供快速传播互动的通道,提升内容和用户的影响力。本次赛题的目标是发现能够最快找到有价值微博的方法,然后应用于平台的内容分发控制策略,对于有价值的内容可以增加曝光量,提高内容的传播互动量。

0
回复
吖吖查
#202 回复于2020-10
数据集名称:冰山数据集Iceberg-Data-Set 数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/5206 数据集简介:冰山图像分类任务,实验所使用的图像为雷达图像,需要参赛者利用算法识别出图像中是冰山(iceberg)还是船(ship)。
展开

这个数据集溜溜溜!!!

0
回复
thinc
#203 回复于2020-10

数据集名称:请假理由

数据集简介:excel格式请假理由,可以用pandas库读取,作为训练文本生成的数据

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/55782

0
回复
Nullius
#204 回复于2020-11

数据集名称: 人脸年龄数据集 face age

数据集链接: https://aistudio.baidu.com/aistudio/datasetdetail/57537

数据集简介:搬运于曾经的一次比赛,数据集共有70类(1到70岁年龄)的人脸数据集。

文件夹名为编号名,例如001文件夹对应存放1岁的数据集,其中单张图片大小200x200、3通道、png格式

美中不足的是数据集分布并不均匀

可用于训练细粒度分类

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户