【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!
AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~
- 筛选功能
- 自定义标签
- Markdown编辑器
数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview
有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~
活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末。
奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~
https://ai.baidu.com/forum/topic/show/990477
数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。
活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。
小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
数据集名称:哈德利中心海冰和海面温度数据集(HadISST)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/21023
数据集简介:SST数据取自气象局海洋数据库(MDB),从1982年开始,该数据库还包括通过全球电信系统(GTS)接收的数据。为了增加数据覆盖范围,在没有MDB数据的情况下,还使用了来自海洋和大气综合数据集(COADS)(现为ICOADS)的1871-1995年的每月SST中值。海冰数据来自多种来源,包括数字化海冰图和被动微波检索。 HadISST1温度是使用两步缩小空间的最优插值过程重建的,然后将质量改进的网格观测值叠加到重建物中以恢复局部细节。通过对基于卫星微波的海冰浓度进行补偿,以补偿表面融化对北极取水的影响以及对南极洲算法缺陷的影响,并使历史原地浓度与卫星数据保持一致,从而使海冰场更加均匀。利用海表温度与海冰浓度之间的统计关系来估算海冰附近的海表温度。
数据集名称:二次元人物头像
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/17962
数据集简介:通过爬虫爬取共50000张头像,爬取著名的动漫图库网站的http://safebooru.donmai.us/和http://konachan.net/ 的动漫图片。
数据集名称:唐诗集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/58194
数据集简介:由唐诗组成,包含唐诗57580首125字(不足和多余125字的都被补充或者截断)、ix2word以及word2ix共三个字典存储为numpy数据格式(.npz)
数据集名称:垃圾邮件
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66118
数据集简介:包含正常邮件和垃圾邮件,可用于朴素贝叶斯分类
数据集名称:一线城市快餐品牌
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66260
数据集简介:Python爬取大众点评快餐店铺数据。 包含城市:北京、上海、广州、深圳 包含餐饮品牌:沙县小吃、兰州拉面、肯德基、麦当劳、星巴克、瑞幸咖啡
数据集名称:女装网购反馈信息数据
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66370
数据集简介:包含 Clothing ID Age Title Review Text Rating Recommended IND Positive Feedback Count Division Name Department Name Class Name 10个属性
数据集名称:城市街景和雾霾景观数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66374
数据集简介:包含城市街景和雾霾景观图片数据集
数据集名称:汽车贷款违约预测
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66512
数据集简介:金融机构因车辆贷款违约而遭受重大损失。这导致汽车贷款拒收率上升。这些机构需要一项研究来估计汽车贷款违约的决定因素
数据名称:北京二手房信息
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/66531
数据简介:2014年北京二手房信息。包含dist roomnum halls AREA floor subway school price 八个字段
数据名称:农村电子商务
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/66731
数据简介:最近要写农村电子商务的调研报告,从知网以关键词“农村电子商务”和“农产品电子商务”爬取了些文献列表,放上来分享给大家,后面自己写报告用
ps.这个帖子的点赞为什么是-1??
数据集名称:CAMUS 心脏分割数据集,含500名患者的超声数据
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/66872
数据集简介:每幅图像含背景,左心室腔,心肌和左心房腔四个类别,数据集由圣埃蒂安大学医院(法国)收集、标注,仅可用于研究目的。
数据集名称:IXI Dataset之脑部MR图像T1和T2(nii格式,约600个健康头部)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/62401
数据集简介:数据搬运来源https://brain-development.org/
数据集名称:IXI Dataset之脑部MR图像MRA(nii格式,约600个头部)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/62444
数据集简介:数据搬运来源https://brain-development.org/
数据集名称:IXI Dataset之脑部MR图像PD加权(nii格式,约600个头部)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/63133
数据集简介:数据搬运来源https://brain-development.org/
数据集名称:IXI Dataset之脑部MR图像DTI(nii格式,约600个头部)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/63140
数据集简介:数据搬运来源https://brain-development.org/
数据名称:零基础入门NLP - 新闻文本分类
数据链接:https://aistudio.baidu.com/aistudio/datasetdetail/66873
数据简介:包含训练集和测试集下载地址
是不是点赞的被封了哈哈哈,我点了个赞,现在是0
数据集名称:T1_T2_mri_100
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/61406
数据集简介:包含100张训练集合和20张测试集。每张图片都是512*256。相当于一张256*256MRT1的脑部图片和一张相同位置的256*256MRT2的脑部图片横着并在一起
数据集名称:西班牙到英语翻译
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/67102
数据集简介:txt文件,每一行的格式为(英语 西班牙语),可用于机器翻译.相关项目:https://aistudio.baidu.com/aistudio/projectdetail/1428411
数据集名称:130dogs
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/67025
数据集简介:这是清华大学图形学实验室发布全球最大的狗细分类数据集,里面包括TrainValSplit.zip,low-annotations.zip,low-resolution.zip三个文件,TrainValSplit.zip是划分训练集和验证集的文档,low-annotations.zip是图像标注文档,low-resolution.zip是130类狗狗的图像,更多信息可以查看:https://cg.cs.tsinghua.edu.cn/ThuDogs/