【投稿赢积分】AI studio优质数据集征集活动开始啦~
收藏
为了帮助更多的优质内容产出、沉淀AI studio优质数据集和丰富现有数据集的种类,向广大用户征集优质数据集。成功加精可获得积分、百度周边礼品,欢迎大家踊跃投稿~
活动时间:
2022年全年
加精数据集能获得:
数据集公开,积分+5,系统自动发放
数据集通过审核后,可获得10-50分的积分奖励,积分可用于积分商城兑换
积分商城兑换流程:点击【更多】进入积分商场
一键兑换礼品
(智能硬件、超级会员、大额算力、精美周边尽在积分商城)
百度周报礼品
当月数据集累计加精超过15个,将获得十二星座度熊公仔一套(限量两套)
数据集加精要求
1、需要公开
2、不要求原创,但不能和平台原有的数据集重复(30%)
3、标题:包含技术关键词或者场景关键词(10%)
4、正文:介绍尽可能详细,需要包括数据集组成、数量以及可应用的场景等信息(30%)
5、验证:需要对数据集进行验证,在AI studio运行1-2轮跑通即可,并在末尾附上VDL可视化截图,证明此数据已通过验证(30%)
参考示例:https://aistudio.baidu.com/aistudio/datasetdetail/157101
括号内内容为数据集获得积分的权重
投稿方式
①在此贴回复想要投稿的数据集
②投稿时间截止至每周三中午12点,下午反馈投稿意见
③符合加精要求,将在周四下午加精
投稿格式
数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。
2
收藏
数据集名称:RAF-DB 表情识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125460
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:“拓尔思杯”中文隐式情感分析评测(SMP-ECISA2019)数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/95890
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:AI-Challenger-Scene-Classification 场景识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125398
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:MIT_Indoor67 室内场景识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125407
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:FER-2013 表情识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125526
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:ExpW 表情识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125540
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:Scene15 场景识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125738
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:SUN397 场景识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125762
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:DisneylandReviews 迪士尼评论数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/126093
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
FERPlus
数据集名称:FERPlus 表情识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/139664
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:推特文本情感分类
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/158282
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:Online Retail 用户消费数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/141209
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:ExpWimage_align 表情识别数据集(对齐)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/126876
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:ExpW 表情识别数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/125540
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
期望能在加精后,告诉我加精了多少,我是奔着‘十二星座度熊公仔’来的。啊哈哈哈~
数据集名称:DocRED文档级关系抽取数据集、
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/172987
数据集简介:DocRED是一个从Wikipedia和Wikidata构建的大规模人工标注的文档级RE数据集,具有以下三个特征。(1)DocRED包含132375个实体和56354个关系事实,标注在5,053个百科文档上,使其成为最大的人工标注文档级RE数据集。(2)由于DocRED中至少有40.7%的关系事实只能从多个句子中抽取,因此DocRED需要阅读文档中的多个句子来识别实体,并通过综合文档的所有信息来推理其关系。这使得DocRED区别于那些句子级的RE数据集,(3)还提供了大规模的远距离有监督数据来支持弱监督的RE研究。
数据集名称:GDA生物医学领域的大规模数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/172989
数据集简介:基因-疾病关联数据集也是一个识别基因和疾病概念相互作用的二元关系分类任务,但它的规模要大得多,是通过使用MEDLINE摘要的远距离监督构建的。它包括29192个文件作为训练集,1000个文件作为测试集。由 2 万~3 万篇训练文档组成
数据集名称:CDR生物领域文档级数据集(关系抽取)
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/172992
数据集简介:CDR**是生物领域的一个人工标注的一个数据集,其任务是预测化学和疾病概念之间的二元相互作用,包含了 500 多篇训练文章;20mb 2016 ;化学-疾病反应数据集是一个使用PubMed摘要构建的生物医学数据集。它总共包含1500个人类注释的文件,被平均分成训练、开发和测试集。CDR是一个二元分类任务,旨在识别化学实体与疾病实体之间的诱导关系,这对生物医学研究具有重要意义。
数据集名称:百度点石杯情感极性分析数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/173029
我在AI Studio上获得钻石等级 https://aistudio.baidu.com/aistudio/personalcenter/thirdview/160759
数据集名称:【NLP】English-Spanish
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/173968/0
数据集简介:该数据集共含有118964对(english,spanish)语句对,可用于神经机器翻译任务。
数据集名称:【Audio】LJSpeech
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/174581
数据集简介:
这是一个公共领域的语音数据集,由13,100个简短的音频片段组成。
单个说话者阅读7本非小说类书籍中的段落。每个片段的转录
为每个片段提供转录。短片的长度从1秒到10秒不等,总长度约为24小时。
总长度约为24小时。
这些文本在1884年至1964年间出版,属于公共领域。
音频是由LibriVox项目在2016-17年录制的,也属于
属于公有领域。