【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 78249 354
【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 78249 354

【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!


AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~

  • 筛选功能

  • 自定义标签

  • Markdown编辑器

数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview

有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~


活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末


奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~

https://ai.baidu.com/forum/topic/show/990477

数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。


活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。

小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。

 

数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。

 

3
收藏
回复
全部评论(354)
时间顺序
leigangblog
#245 回复于2021-01

数据集名称:Tsinghua Dogs

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66333

数据集简介:对清华大学图形学实验室发布全球最大的狗细分类数据集进行小修改,参考链接:https://cg.cs.tsinghua.edu.cn/ThuDogs/,目前能够直接用于paddlex等框架的训练

0
回复
周小鱼whoyou
#246 回复于2021-01

数据集名称:全球230个国家和地区按年统计的新生儿数量及出生率数据
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66768
数据集简介:包含联合国发布的230个国家和地区从1961年开始的新生儿数据,包含年国家、年代、新生儿数量、出生率等字段。出生率是指人类在一定时期内(通常为一年)平均每千人所出生的人数的比率。经济发展水平较高、文化教育普及的地区,出生率就低,反之,就高一些。通过对婴儿出生率长期跟踪,可以预估一个国家20年后的劳动人口数量以及经济状况,预测人工智能生产力与人口数量下降是否匹配,预测人口与养殖业投资规模匹配情况。

0
回复
AIStudio810259
#247 回复于2021-01

数据名称:Microsoft新闻推荐数据集
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/67598
数据简介:背景描述
新闻推荐是个性化新闻服务的重要技术。与已经进行了全面研究的产品和电影推荐相比,新闻推荐的研究更为有限,这主要是由于缺乏高质量的基准数据集。
新闻推荐的MIND数据集是从Microsoft新闻网站的匿名行为日志收集的。
该数据从2019年10月12日至11月22日的6周内随机抽样了100万用户,这些用户至少获得了5次新闻点击。为保护用户隐私,每位用户在安全地哈希为匿名ID后都会与生产系统断开链接。还收集了这段时间内这些用户的新闻点击行为,并将其格式化为印象日志。
印象日志已在上周用于测试,而日志已在第五周用于培训。对于训练集中的样本,请使用前四周的点击行为来构建新闻点击历史记录以进行用户建模。
在训练数据中,第五周最后一天的样本用作验证集。该数据集是MIND的小版本(MIND-small),通过随机抽样50,000个用户及其行为日志。MIND-small数据集中仅包含训练和验证集。
数据说明
behaviors.tsv:用户的点击历史和新闻点击
news.tsv:新闻文章的信息
entity_embedding.vec:从知识图中提取的新闻中的实体嵌入
lation_embedding.vec:从知识图中提取的实体之间的关系的嵌入
behaviors.tsv包含用户的点击历史和新闻点击
Impression ID. 印象ID
User ID. 用户的匿名ID
Time. 印象时间格式"MM/DD/YYYY HH:MM:SS AM/PM"
History. 此用户在此印象之前的新闻点击历史(点击新闻的ID列表)。点击的新闻文章按时间排序
印象。在此印象中显示的新闻列表和用户的点击行为(1为点击,0为非点击)。印象中的新闻顺序被打乱了
news.tsv包含了新闻文章中涉及到的行为的详细信息。
News ID 新闻ID
Category 类别
SubCategory 子类别
Title 标题
Abstract 摘要
URL 网址
Title Entities (entities contained in the title of this news) 标题实体(包含在新闻标题中的实体)
Abstract Entities (entites contained in the abstract of this news 抽象实体(该新闻摘要中包含的实体)
数据来源
Paper: MIND: A Large-scale Dataset for News Recommendation
Fangzhao Wu†, Ying Qiao‡, Jiun-Hung Chen‡, Chuhan Wu§, Tao Qi§,Jianxun Lian†, Danyang Liu†, Xing Xie†, Jianfeng Gao†, Winnie Wu‡, Ming Zhou†
https://www.microsoft.com/en-us/research/publication/mind-a-large-scale-dataset-for-news-recommendation/

 

0
回复
super松
#248 回复于2021-01

数据集名称:动漫人脸识别训练集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/67783
数据集简介:爱奇艺官方动漫人脸识别竞赛训练集

0
回复
super松
#249 回复于2021-01

数据集名称:动漫人脸识别测试集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/67784
数据集简介:爱奇艺官方动漫人脸识别竞赛测试集

0
回复
AIStudio810259
#250 回复于2021-01

数据集名称:N-Gram模型在莎士比亚文集中训练所用数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/67821

数据集简介:N-Gram模型在莎士比亚文集中训练所用数据集

 

0
回复
AIStudio810259
#251 回复于2021-01

数据集名称:170K+首Spotify歌曲数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/68030
数据集简介:数据包含从Spotify Web API收集的1921年至2020年之间发行超过170.000首歌曲

0
回复
AIStudio810259
#252 回复于2021-01

数据集名称:128K张MMA面部表情图像数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/68156
数据集简介:MMAFEDB包含用于培训,验证和测试的目录。每个目录包含对应于七个面部表情类别的七个子目录。

0
回复
陈鹏烨
#253 回复于2021-01

这个厉害了,收藏,收藏

0
回复
Cyber巨蟹
#254 回复于2021-01

https://aistudio.baidu.com/aistudio/datasetdetail/63413

数据集简介:纯卫星图像,使用Planet卫星图像对San Franciso Bay中的船只进行分类

0
回复
nanting03
#255 回复于2021-01

数据集名称:Diving48
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/56350
数据集简介:跳水竞赛的视频片段,用来做跳水动作的视频分类。包含16k个左右的训练视频和2k个左右的测试视频。搬运来源http://www.svcl.ucsd.edu/projects/resound/dataset.html

0
回复
乌拉__----
#256 回复于2021-02

数据集名称:FaceForensics++数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/49510

数据集简介:《Few-shot video to video synthesis》FaceForensics++数据集包含977个脸部说话视频 以及 json, 由于数据集过大,分为了5个压缩包。该数据集是一个面部伪造数据集,它使研究人员能够以有监督的方式训练基于深度学习的方法。数据集包含使用四种最新方法创建的操作,即Face2Face、FaceSwap、DeepFakes和NeuralTextures。

来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/311241

 

0
回复
h
herui2
#257 回复于2021-02

数据集名称:方向盘操作手检测数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/69849

数据集简介:包含几千张voc格式标注的在方向盘上的操作手的数据集,以前做方向盘脱手检测的时候用的

0
回复
h
herui2
#258 回复于2021-02

数据集名称:HKU-IS显著性检测

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/69843

数据集简介:HKUIS显著性检测数据集,搬运自https://i.cs.hku.hk/~gbli/deep_saliency.html

0
回复
院长灿爷
#259 回复于2021-02

哈哈,来看看有没有关于有标签的评论数据,比如淘宝、京东、亚马逊等评论数据,研究这些评论是否是真实评论,或者虚假的刷单评论。

0
回复
Fitzie
#260 回复于2021-02

数据集名称:Gazebo锥桶检测数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/43886

数据集介绍:Gazebo仿真环境中的锥桶数据集,VOC格式手工标注,很适合需要在gazebo仿真环境中检验自动驾驶算法的朋友,欢迎同道朋友一起来讨论嗷

0
回复
AIStudio810259
#261 回复于2021-02

数据集名称:《你好李焕英》豆瓣影评

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/71070

数据集简介:接近5000余条《你好李焕英》豆瓣影评数据

0
回复
Thomas-yanxin
#262 回复于2021-02

数据集名称:TACO垃圾分类数据集

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/71124

数据集简介:TACO是一个数据正在不断增长的垃圾对象数据集,其以树林、道路和海滩为拍摄背景,目前包含60个类别的垃圾对象,共1500张图像,近5千份标注。

 

0
回复
Thomas-yanxin
#263 回复于2021-02

数据集名称:“华为云杯”2020深圳开发数据应用创新大赛——垃圾分类目标检测

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/70484

数据集简介:VOC格式的垃圾分类目标检测数据集

0
回复
BIT可达鸭
#264 回复于2021-02

项目标题:PARL强化学习——合成大西瓜

项目链接: https://aistudio.baidu.com/aistudio/projectdetail/1556392

项目简介:用DQN强化学习算法玩“合成大西瓜”!

我在AI Studio上获得至尊等级,点亮7个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/67156

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户