【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!
AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~
- 筛选功能
- 自定义标签
- Markdown编辑器
数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview
有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~
活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末。
奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~
https://ai.baidu.com/forum/topic/show/990477
数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。
活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。
小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
数据集名称:英文手写字母数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/86483
数据集简介:3410张手写a-z,A-Z,0-9,总计62类(有些大小写一样),每类55张手写图片
数据集名称:磁共振图像脊柱结构多类别三维自动分割
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/81211
数据集简介:数据集来源https://www.spinesegmentation-challenge.com/
是一个分割数据集,数据格式是nii.gz。分割磁共振T2腰椎矢状位,加背景一共20类,椎体有S、L5、L4、L3、L2、L1、T12、T11、T10、T9,椎间盘有L5/S, L4/L5, L3/L4, L2/L3, L1/L2, T12/L1, T11/T12, T10/T11, T9/T10
数据集名称:胸部X光分割数据(肺部和心脏标签)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/67397
数据集简介:对网上公开的X光胸片肺炎分类数据集进行二次标注,变成是分割数据集。一共有101张
origin是一张X光胸片是jpg格式。mask是nii.gz格式。有三个标签有背景,肺部(双肺为一类),心脏。注意mask标签的CT值。
数据集名称:手部X光骨龄1000张(基于RUS-CHN法)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/36951
数据集简介:数据来源2017RSNA骨龄预测比赛。这个比赛数据集每一张都是手部X光图片。取1000张对图片进行二次标注,成为目标检测数据。主要针对目前比较公认的骨龄计分法《中华05》中RUS-CHN法进行标注。数据类别有:桡骨、尺骨、第一近节指骨、第一远节指骨、掌骨、近节指骨、中节指骨和远节指骨。
数据集名称:X光手部小关节分类数据集(基于骨龄计分法RUS-CHN)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/69582
数据集简介:《中华05》中的骨龄计分法RUS-CHN中,分了桡骨图谱、尺骨图谱、第一掌骨图谱、第一近节图谱、第一远节图谱、第三和五掌骨、第三和五近节指骨、第三和五中节指骨、第三和五远节指骨。一共有9个图谱。每一个图谱中对应10到14个不等的等级。
这个数据就是根据以上的图谱,对小关节图片进行分类标注。
数据集名称:Gazebo锥桶检测数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/43886
对应精品项目产出:https://aistudio.baidu.com/aistudio/projectdetail/1608121
数据集介绍:Gazebo仿真环境中的锥桶数据集,VOC格式手工标注,很适合需要在gazebo仿真环境中检验自动驾驶算法的朋友
这个数据集名称就是5G? 看着有点不理解呀
你是上传了一张图?
数据集名称:复杂背景下的5和其他手势
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/88213
数据集简介:常见的一些手势数据的背景都很单调,在复杂背景的条件下效果会很不好,使用paddlehub先分割除了人手并增广数据,制作复杂背景的手势数据集。由于我的任务只需要区分5和其他,所以只分了两类
岩石薄片偏光电镜数据集
2区SCI 数据集 Rock thin sections identification based on improved squeeze-and-Excitation Networks model
岩石薄片多标签分类,近3千张样本,105中细分类别,覆盖90%以上常见岩石类型
啊哈哈哈,开始发不上来。。。。。。
真不错
数据集名称:岩石薄片偏光电镜数据集
数据集链接:岩石薄片偏光电镜数据集-百度AI Studio - 人工智能学习与实训社区 (baidu.com)
数据集简介:2区SCI 数据集 Rock thin sections identification based on improved squeeze-and-Excitation Networks model
岩石薄片多标签分类,覆盖90%以上常见岩石类型
来AI Studio互粉吧~等你哦~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/260495
清洗后的数据更好!
数据集名称:3D人体目标检测与行为分析竞赛数据集2
数据集地址:https://aistudio.baidu.com/aistudio/datasetdetail/89218
数据集说明:随着人们对隐私保护意识逐渐增强,3D深度相机由于只记录深度信息、不采集纹理信息的特性,使其取代RGB相机来实现某些场景的智能监控成为大势所趋;基于3D深度信息的算法研发是行业刚需,对于隐私敏感的应用场景有十分重要的意义。本赛道数据集是由3D相机采集的非公开真实场景数据,场景包括办公室行人场景、走廊行人场景。未标注系列
数据集名称:街景分割
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/89936
数据集简介:
①背景描述:数据集包含945张图片,图片已经注释了天空,建筑物,道路,人行道,植被,窗户,门和汽车等的标签信息,用于语义图像分割任务。
②数据说明:数据集包括用于训练的100张图像和用于测试的845张图像(详细信息请参阅train.txt和test.txt)。
标签的颜色代码为(R:G:B):
various = 0:0:0
building = 128:0:0
car = 128:0:128
door = 128:128:0
pavement = 128:128:128
road = 128:64:0
sky = 0:128:128
vegetation = 0:128:0
window = 0:0:128
https://zhuanlan.zhihu.com/p/195699093
这个里面提了很多数据集, 可以一起搬一下~ (AIStudio已有的不算)~
数据集名称:TREC2005-2007垃圾邮件数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/89631
数据集简介:trec2005-2007。由国际文本检索会议提供,分为英文数据集(trec05-07p)和中文数据集(trec06c),其中所含的邮件均来源于真实邮件保留了邮件的原有格式和内容。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149
数据集名称:15类蜘蛛数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/90355
数据集简介:2186个图像文件224 X 224 X 3 jpg格式,分为15个子目录,每个子目录一个
我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/89263