【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!
AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~
- 筛选功能
- 自定义标签
- Markdown编辑器
数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview
有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~
活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末。
奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~
https://ai.baidu.com/forum/topic/show/990477
数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。
活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。
小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
数据集名称:ModelNet10
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/108288
数据集简介:该数据集包含浴缸、床、椅子、桌子等10类CAD家具模型。
太漂亮了,必须体验一把
数据集名称:手势识别数据集-ASLLVD
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/108475
数据集简介:国外手势数据集,内含多个标注人员的视频手势以及标签信息
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:丁香园新型冠状病毒(COVID-19)疫情时间序列数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106006
说明:本项目为2019新型冠状病毒(COVID-19/2019-nCoV)疫情状况的时间序列数据仓库,数据来源为丁香园。 最后更新于 2020-07-27
数据集名称:电信客户流失数据
数据集地址:https://aistudio.baidu.com/aistudio/datasetdetail/106009
数据集说明:专注的客户保留计划。
数据集名称:英文手写字母数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/86483
数据集简介:3400张手写字母,分别是a-z, A-Z,0-9
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:英文手写字母数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/86483
数据集简介:3400张手写字母,分别是a-z, A-Z,0-9
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:中文手写数字 MNIST数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/61843
数据集简介:总共15000张中文手写数字汉字灰度图片,以numpy.ndarray数据类型保存每张图片尺寸为64×64。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:推特文本情感13分类数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/107057
数据集简介:30000条数据。tweet_id string 推文数据的唯一ID,比如test_0,train_1024;content string 推特内容;
label int 推特情感的类别,共13种情感。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:seaborn20余个官方数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/105099
数据集简介:seaborn自带官方数据集,https://github.com/mwaskom/seaborn-data。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:人脸情绪识数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/100671
数据集简介:训练集:2.8W张人脸图像;测试集:7K张人脸图像;共计分为angry、disgusted、fearful、happy、neutral、sad、surprised等7种表情。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:中文谣言语料库
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106266
数据集简介:该数据为从新浪微博不实信息举报平台抓取的中文谣言数据。包含从2009年9月4日至2017年6月12日的31669条谣言。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:昆虫分类数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/102711/0
数据集简介:昆虫分类的数据集,包含蚂蚁和蜜蜂两类样本。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:【原创】人脸解析数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/109396
数据集简介:分为训练集、验证集、测试集。训练集为1200段,验证集为100段,测试集为100段,每段有20张图片。
可用于短视频中的人脸解析。
数据集名称:盐体分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/109943
数据集简介:训练集包含4000幅101 x 101像素地震图像和与其对应的标示出盐体的mask图像、地下深度数据,测试集包含18000幅相同大小的地震图像和与其对应的深度数据,最终使用算法为18000幅地震图像生成盐体mask图像。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
迟到
数据集名称:天宫遥感图像自然场景智能识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/110113
数据集简介:基于“天宫二号”宽波段成像仪数据的大尺度进行典型场景智能识别,场景类型包括海滩、圆形农田、云、荒漠、林地、山脉、矩形农田、建筑区、河流和雪山共10类,共20000张图像,其中2000张为训练集,18000张为测试集。要求参赛选手利用机器学习等智能算法自动识别出所规定的测试集图像对应的场景类型。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:nsfw_data_scraper-master
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/110273/0
数据集简介:数据集中提到的5种类别的可能性。分别是:hentai、sexy、neutral、drawings、porn,放心,没你们想的那样,都是链接txt,具有一定的行业价值。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263
数据集名称:2021全球抗体亲和力预测大赛A轮数据
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/110797
数据集简介:通过生物计算,寻求最佳的抗体和抗原结合力,就是俗称寻求最佳抗体亲和力。数据集来源自公开数据集和文献收集到的抗体亲和力数据,训练集包含抗体抗原复合物473条,总共序列对1706条;测试集A包含抗体抗原复合物37条,总共序列对178条
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263