【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!
AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~
- 筛选功能
- 自定义标签
- Markdown编辑器
数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview
有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~
活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末。
奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~
https://ai.baidu.com/forum/topic/show/990477
数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。
活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。
小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
数据集名称:FaceForensics++数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/49510
数据集简介:论文《Few-shot video to video synthesis》FaceForensics++数据集包含977个脸部说话视频 以及 json, 由于数据集过大,分为了5个压缩包。
来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/311241
现在数据集更新了,最大能放50G
还好,上传的时候上限100g,数据集有36g
公开数据集不占用50个的上限限制了哈~
又可以愉快的搬运数据集了
数据集名称:红酒数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/42042
数据集简介:红酒数据集 这个数据集有1599个样本,11个红酒的理化性质,以及红酒的品质(评分从0到10)
奥里给!我先冲了,兄弟萌
数据集名称:银行存款数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/51950
数据集简介:银行存款数据集 预测分析 根据客户特征(年龄、工作类型、婚姻状况、文化程度、是否有房贷和是否有个人贷款),预测客户是否愿意办理定期存款业务。
字段名
含义
类型
描述
attr_1
年龄
Int
表示客户的年龄。
attr_2
职业
String
表示客户所从事的职业。
attr_3
婚姻情况
String
表示客户是否结婚或已离异。
attr_4
教育情况
String
表示客户受教育的程度。
attr_5
房产情况
String
表示客户名下是否有房产。
attr_6
贷款情况
String
表示客户名下是否有贷款。
attr_7
存款情况
String
表示客户名下是否有存款。
attr_1
attr_2
attr_3
attr_4
attr_5
attr_6
attr_7
31
blue-collar
married
secondary
yes
no
no
41
management
married
tertiary
yes
yes
no
38
technician
single
secondary
yes
no
no
39
technician
single
secondary
yes
no
yes
39
blue-collar
married
secondary
yes
no
no
39
services
single
unknown
yes
no
no
数据集名称:一见钟情数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/52008
数据集简介:
>一见钟情学习赛,受到哥伦布亚商学院教授Ray Fisman和Sheena Iyengar联合发布的文章《伴侣选择中的性别差异(Gender Differences in Mate Selection: Evidence From a Speed Dating Experiment)》启发,决定利用机器学习的数据实验来分析当下男女在相亲交友时,个人的内在外在各类因素对最终相亲结果的影响。
>在2002年-2004年期间,Ray Fisman教授和Sheena Iyengar教授在筹备论文时,邀请志愿者参加闪电速配实验(相亲车轮战,每4分钟与一名相亲对象快速沟通,然后再换下一个相亲对象),提供一些相关的个人信息给相亲对象,并询问相亲对象给出是否愿意在不久的未来再次见面。本次学习赛的分析数据,记录了当时一见钟情相亲实验时,志愿者的相关信息及相亲结果。
>数据集的内容包括实验志愿者的性别、年龄、人种、专业、地区、收入等特征,以及志愿者对配偶是否来自同一地区、同一信仰等观点的预期。
有心了哈哈哈
继续搬运
数据集名称:冰山数据集Iceberg-Data-Set
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/5206
数据集简介:冰山图像分类任务,实验所使用的图像为雷达图像,需要参赛者利用算法识别出图像中是冰山(iceberg)还是船(ship)。
数据标题:遥感影像-场景分类 深度学习数据集汇总
数据链接:https://aistudio.baidu.com/aistudio/projectdetail/882508
数据简介:遥感影像-场景分类 深度学习数据集汇总
数据标题:精灵宝可梦数据集pokemon0820
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/53877
数据简介:本数据涵盖了从第一代到第七代共801只宝可梦小精灵的信息。数据特征上包含了基础的能力值,对于其他属性的克制能力,身高,体重,种类等等。数据来源为 http://serebii.net/
数据标题:快来一起挖掘幸福感
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/53880
数据简介:考虑到变量个数较多,部分变量间关系复杂,数据分为完整版和精简版两类。可从精简版入手熟悉赛题后,使用完整版挖掘更多信息。complete文件为变量完整版数据,abbr文件为变量精简版数据。
index文件中包含每个变量对应的问卷题目,以及变量取值的含义。
survey文件是数据源的原版问卷,作为补充以方便理解问题背景。
数据来源:赛题使用的数据来自中国人民大学中国调查与数据中心主持之《中国综合社会调查(CGSS)》项目。赛题感谢此机构及其人员提供数据协助。中国综合社会调查为多阶分层抽样的截面面访调查。
数据标题:快来一起挖掘幸福感
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/53883
数据简介:新浪微博作为中国最大的社交媒体平台,旨在帮助用户发布的公开内容提供快速传播互动的通道,提升内容和用户的影响力。本次赛题的目标是发现能够最快找到有价值微博的方法,然后应用于平台的内容分发控制策略,对于有价值的内容可以增加曝光量,提高内容的传播互动量。
这个数据集溜溜溜!!!
数据集名称:请假理由
数据集简介:excel格式请假理由,可以用pandas库读取,作为训练文本生成的数据
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/55782
数据集名称: 人脸年龄数据集 face age
数据集链接: https://aistudio.baidu.com/aistudio/datasetdetail/57537
数据集简介:搬运于曾经的一次比赛,数据集共有70类(1到70岁年龄)的人脸数据集。
文件夹名为编号名,例如001文件夹对应存放1岁的数据集,其中单张图片大小200x200、3通道、png格式
美中不足的是数据集分布并不均匀
可用于训练细粒度分类