【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 78057 354
【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 78057 354

【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!


AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~

  • 筛选功能

  • 自定义标签

  • Markdown编辑器

数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview

有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~


活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末


奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~

https://ai.baidu.com/forum/topic/show/990477

数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。


活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。

小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。

 

数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。

 

3
收藏
回复
全部评论(354)
时间顺序
AIStudio810259
#305 回复于2021-05

数据集名称:70类运动图像数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/90390

数据集简介:70种 10782 张 224 X224 X 3大小 jpg运动图像,分为训练目录,测试目录和验证目录

我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263

0
回复
JavaRoom
#306 回复于2021-05

数据集名称:民宿价格数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/90992
数据集简介:59288行民宿数据记录
我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263

0
回复
JavaRoom
#307 回复于2021-05

数据集名称:共享单车使用数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/91714

数据集简介:
1) 2015_status_data.csv - records of bike and dock availability
2) 2015_station_data.csv - station latitude, longitude, name, dockcount, online date
3) 2015_trip_data.csv - records of individual trips
4) 2015_weather_data.csv - daily weather by city
更多介绍请看数据集介绍我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263

0
回复
hrdws
#308 回复于2021-05

数据集名称:FC100数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/92333

数据集简介:FC100数据集全称是Few-shot CIFAR100数据集,与CIFAR-FS数据集类似,同样来自CIFAR100数据集,共包含100类别,每个类别600张图像,合计60,000张图像。但不同之处在于  FC100不是按照类别(Class)进行划分的,而是按照超类(Superclass)进行划分的。共包含20个超类(60个类别),其中训练集12个超类,验证集4个超类(20个类别),测试集4个超类(20个类别)。参考文献:Oreshkin B, López P R, Lacoste A. Tadam: Task dependent adaptive metric for improved few-shot learning[C]//Advances in Neural Information Processing Systems. 2018: 721-731.

我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ 

我在AI Studio上获得白银等级,点亮1个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/527829

1
回复
hrdws
#309 回复于2021-05

数据集名称:tieredImageNet

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/92380

数据集简介:tieredImageNet数据集也是从ImageNet数据集中选取的,包含34个大类(Categories),每个大类有包含10-30个小类(Classes),每个类别有数量不等的多个图像样本,共计608个类别,779,165张图像(平均每个类别包含1281张图片)。34个大类可划分为训练集(20大类),验证集(6大类)和测试集(8大类)。参考文献:Ren M, Triantafillou E, Ravi S, et al. Meta-learning for semi-supervised few-shot classification[J]. arXiv preprint arXiv:1803.00676, 2018.

我在AI Studio上获得白银等级,点亮1个徽章,来互关呀~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/527829

1
回复
三岁
#310 回复于2021-05

数据集名称:21西交大da数据竞赛train

数据集地址:https://aistudio.baidu.com/aistudio/datasetdetail/92747

数据集简介:ikcest第三届一带一路国际大数据竞赛暨第七届百度&西安交通大学da数据竞赛预赛train

我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/284366

0
回复
c
chen_siyuan
#311 回复于2021-05

小编,建议直接引入百度战略投资的聚宽的量化数据,肯定引爆量化投资行业!

0
回复
O国殇O
#312 回复于2021-06

数据集名称:医疗显微图像-结核杆菌-目标检测任务

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/83968/0

数据集简介:
背景描述
结核病是由结核杆菌感染引起的慢性传染病。结核菌可能侵入人体全身各种器官,但主要侵犯肺脏,称为肺结核病。
结核病是青年人容易发生的一种慢性和缓发的传染病。潜伏期4~8周。其中80%发生在肺部,其他部位(颈淋巴、脑膜、腹膜、肠、皮肤、骨骼)也可继发感染。人与人之间呼吸道传播是本病传染的主要方式。传染源是接触排菌的肺结核患者。随着环境污染和艾滋病的传播,结核病发病率越发强烈。除少数发病急促外,临床上多呈慢性过程。常有低热、乏力等全身症状和咳嗽、咯血等呼吸系统表现。
数据说明
该数据集全部与结核有关,取自痰液样本。
它包含1265个痰液图像以及3734个细菌的边界框。XML文件包含图像的边界框详细信息。
我在AI Studio上获得白银等级,点亮2个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/710957

0
回复
O国殇O
#313 回复于2021-06

数据集名称:蜜蜂还是黄蜂

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/96011

数据集简介:
19480张照片蜜蜂、黄蜂和其他昆虫。

0
回复
JavaRoom
#314 回复于2021-06

数据集名称:商品评论情感预测数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/96333
数据集简介:52 万件商品,1100 多个类目,142 万用户,720 万条评论/评分数据
我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263

0
回复
Medlen
#315 回复于2021-06

数据集名称:CB6133

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/79771

数据集简介:此数据集用于做蛋白质二级结构预测或蛋白质水溶性预测。是ICML 2014年发布的公开数据集。包含CB6133、CB513、cullPDB三个主要数据集。

0
回复
bnmvv5
#316 回复于2021-06

数据集名称:长光卫星_高分辨率遥感影像耕地地块提取挑战赛

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/96796

数据集简介:2021长光卫星高分辨率遥感影像耕地地块提取挑战赛,大赛以吉林一号高分辨率卫星遥感影像作为数据集,参赛选手需基于提供的样本构建模型,预测未知影像中耕地的矢量边界范围。

0
回复
bnmvv5
#317 回复于2021-06

 

数据集名称:长光卫星_高分辨率遥感影像耕地地块提取挑战赛

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/96796

数据集简介:2021长光卫星高分辨率遥感影像耕地地块提取挑战赛,大赛以吉林一号高分辨率卫星遥感影像作为数据集,参赛选手需基于提供的样本构建模型,预测未知影像中耕地的矢量边界范围。

0
回复
Niki_173
#318 回复于2021-06

数据集名称:跌倒检测数据集(Fall detection Dataset)

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/94809

数据集简介:里面有1000+图片,以及配套的VOC格式标签文件,可以用于目标检测等任务,后期可用于监控安防等项目工作。

 

0
回复
Niki_173
#319 回复于2021-06

数据集名称:吸烟、抽烟检测数据集(Smoke detection Dataset)

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/94796

数据集简介:里面约有800张图片,以及配套的VOC格式标签文件,可以用于目标检测等任务,后期可用于监控安防等项目工作。

0
回复
iterhui
#320 回复于2021-08

数据集名称:奥特曼图片合集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/101651

数据集简介:共有四种奥特曼的图片,分别为迪迦奥特曼200张、杰克奥特曼100张、泰罗奥特曼150张、赛文奥特曼100张。全部都是jpg

0
回复
炼丹师233
#321 回复于2021-08

数据集名称:OCEMOTION-中文7分类细粒度情感分析数据集
数据集链接:   https://aistudio.baidu.com/aistudio/datasetdetail/100731
数据集简介:OCEMOTION是包含7个分类的细粒度情感性分析数据集,其中7个情感类别分别为sadness、happiness、disgust、anger、like、surprise、fear,适用于构建细粒度情感分析模型。 文件格式为:id 句子 标签,以'\t'分隔。

数据集名称:SMP微博情绪6分类数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/104703
数据集简介:经处理过后的SMP2020微博情绪6分类数据集, 一共包含两种数据集:第一种为通用微博数据集,第二种为疫情微博数据集,将微博按照其蕴含的情绪分为以下六个类别之一:neutral(无情绪)、happy(积极)、angry(愤怒)、sad(悲伤)、fear(恐惧)、surprise(惊奇),适用于构建细粒度情感分析模型。

1
回复
炼丹师233
#322 回复于2021-08

2021DIGIX 全球校园AI算法精英大赛数据集:

 

数据集名称:2021DIGIX-基于多目标多视图的用户留存周期预测

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/105868

数据集简介:2021DIGIX赛题一:基于多目标多视图的用户留存周期预测比赛数据集。比赛数据(采样+脱敏后)抽取的时间范围是连续60 天的用户行为数据和行为对应匹配的用户、歌曲、歌手数据。选手需要利用连续30天的用户行为日志,用户信息,歌曲信息,歌手信息,歌曲音频信息,预测未来30天内用户的留存情况,按未来一日、两日、三日、七日、十四日、三十日分段。

 

数据集名称:2021DIGIX-基于多模型迁移预训练文章质量判别

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/105318

数据集简介:2021DIGIX赛题二:基于多模型迁移预训练文章质量判别比赛数据集。文章质量判别是信息流领域的核心问题,提升文章质量判别的准确率是提升信息流质量和精准推送的核心技术点。赛题提供的基础数据集包含两部分:训练集和测试集。其中训练集给定了该样本的文章质量的相关标签;测试集用于计算参赛选手模型的评分指标,参赛选手需要计算出测试集中每个样本文章质量判断及优质文章的类型。

 

数据集名称:2021DIGIX-基于多目标优化的视频推荐数据集

数据集链接:  https://aistudio.baidu.com/aistudio/datasetdetail/105215

数据集简介:2021DIGIX赛题三:基于多目标优化的视频推荐比赛数据集,赛题提供14天数据用于训练,1天数据用于测试,数据包括用户特征,视频内容特征,以及用户历史行为数据,选手基于给出的数据,提供推荐策略,目标是预测每位用户观看视频时长所在区间,且预测是否对视频进行分享。

 

数据集名称:2021DIGIX-基于多模态多语言的搜索排序

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/105623

数据集简介:2021DIGIX赛题四:基于多模态多语言的搜索排序比赛数据集,赛题为选手提供搜索数据、公开爬取经过清理后的网页属性库,参赛选手基于给定的数据构建召回、排序模型。赛题提供数据集包含两部分:训练集和测试集。其中训练集为若干个Query下的网页排序;测试集选手需提交对提供Query的网页排序,用于计算与真实排序的HIT@K。

1
回复
吖吖查
#325 回复于2021-09

数据集名称:手部X光关键点标注21个点json格式

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106978

数据集简介:

手部X光关键点标注,用labelme标注,一共有21个点,对应21个关节,标注文件是json格式,图片是png。一共有300例

我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/181096

0
回复
吖吖查
#326 回复于2021-09

数据集名称:【原创】手部X光关键点标注21个点json格式

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106978

数据集简介:

手部X光关键点标注,用labelme标注,一共有21个点,对应21个关节,标注文件是json格式,图片是png。一共有300例

我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/181096

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户