【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 537354 356
【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦! 置顶
收藏
快速回复
AI Studio平台使用 其他热门活动 537354 356

【回帖赢大奖】AI Studio优质数据集征集活动&数据集大厅更新啦!


AI Studio 数据集大厅现已更新,搜索数据集新增筛选功能,上传数据集还支持自定义标签、Markdown编辑器等,感兴趣的小伙伴可以上传数据集体验新功能~

  • 筛选功能

  • 自定义标签

  • Markdown编辑器

数据集大厅:https://aistudio.baidu.com/aistudio/datasetoverview

有的小伙伴目前属于学习阶段,申请精品项目有一些困难,不妨试试申请精品数据集,加精成功后也会有积分奖励,同样可以利用积分兑换算力卡以及其他礼品,本次征集还有特殊的活动奖励哦~


活动形式:
创建数据集并公开,根据示例在本帖下按照"数据集名称+数据集链接+数据集简介"的形式回帖,原创数据集标注原创,示例见文末


奖品攻略请查收:
活动特殊福利
1、2021年9月14日至9月22日,按要求回帖,随机抽取3名同学赠送百度联名风扇。
2、2021年9月14日至9月22日,按照回帖时间排列,最早按要求回帖的5名用户将获得度熊公仔。
常规积分奖励
1、数据集公开,积分+5,系统自动发放
2、每周四根据综合质量、引用数等指标进行评选,被选为精品数据集的奖励额外积分(10~60),原创精品数据集,将再获得30积分奖励。
积分每月可以在AI社区、AI Studio积分兑换贴进行兑换,算力卡、定制周边奖励多多~

https://ai.baidu.com/forum/topic/show/990477

数据集要求:
1.需要公开。
2.不要求原创,但不能与平台已有数据集重复。
3.标题需简明扼要,准确表述出数据集内容方向。
4.简介需大致介绍数据集内容/来源/技术方向/数量级等有效信息,供用户快速识别数据集使用。
5.需针对数据集内容选择适合准确的标签。
6.数据集详情描述详细,包括但不限于数据来源、背景、数据分析、目前存在的问题、示例说明等。


活动获奖公告:
2021年9月28日
注:活动最终解释权归AI Studio所有。禁止作弊,如有发现,取消获奖资格。

小编来打个样~
数据集名称:【原创】焊缝分割数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106021
数据集简介:本数据集包含焊缝图像192张,并分别使用伪彩色以及灰度图进行标注,同时提供了对应于两种标注方式的txt,数据集详情使用方法可以查看README。

 

数据集名称:SUN RGB-D数据集
数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/106223
数据集简介:该数据集包含 10335 张真实的房间场景 RGB-D 图像。每个RGB图像都有一个对应的深度和分割图。标记了多达 700 个对象类别。训练集和测试集分别包含 5285 和 5050 张图像。

 

3
收藏
回复
全部评论(356)
时间顺序
代码生成器
#65 回复于2020-05

响应大佬号召,studio医学兴趣组最近推出了医学影像方向的数据集集锦,目前共收录了17个方向的超过50个数据集,并提供简介和Aistudio不限速下载链接,欢迎大家浏览,收藏,fork三连!!!

https://aistudio.baidu.com/aistudio/projectdetail/462184

1
回复
r
rock4you
#66 回复于2020-05

名称:MovieLens 百万数据集 (ml-1m)
http://files.grouplens.org/datasets/movielens/
ml-1m 数据集包含了 6,000 位用户对 4,000 部电影的 1,000,000 条评价,由 GroupLens Research 实验室搜集整理。在原始数据中包含电影的特征数据,用户的特征数据,和用户对电影的评分.

https://aistudio.baidu.com/aistudio/datasetdetail/36345

0
回复
ChunkitLau
#67 回复于2020-05

Amazon Commerce评论集数据集

摘要:该数据集用于在线Writeprint中的作者身份识别,这是模式识别的新研究领域。

https://aistudio.baidu.com/aistudio/datasetdetail/36536

0
回复
thinc
#68 回复于2020-05

数据集名称:HEp-2_6类细胞分类图片

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/36604

数据集简介:

  • data
    • train
    • test
    • train.csv
    • test.csv

train和test文件包含6类图片,train.csv test.csv为测试标签

0
回复
ChunkitLau
#69 回复于2020-05

心律失常数据集

数据集信息:

该数据库包含279个属性,其中206个属性为线性值,其余为名义属性。

关于H. Altay Guvenir的研究:“目的是区分是否存在心律不齐,并将其分为16组之一。01类是“正常”心电图类别02到15是不同类别的心电图心律失常的分类和类别16指的是其余未分类的类别,目前,有一个计算机程序可以进行这种分类,但是心律和程序分类之间存在差异,我们以心律作为黄金标准为目标通过机器学习工具最大程度地减少这种差异。”

最近从数据库中删除了患者的姓名和身份证号码。

https://aistudio.baidu.com/aistudio/datasetdetail/36732

0
回复
thinc
#70 回复于2020-05

数据集名称:商品描述文案

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/36884

数据集简介:阿里平台有很多达人、商家等撰写的文案。这份数据集将其中部分文案加工整理,用以帮助研究者对于文本生成方面进行研究

来AI Studio粉我吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/212554

0
回复
ChunkitLau
#71 回复于2020-05

剖腹产分类数据集

https://aistudio.baidu.com/aistudio/datasetdetail/37004

0
回复
thinc
#72 回复于2020-05

数据集名称:鲍鱼

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/37048

数据集简介:此数据集为4177行,9列,分别为性别、长度、直径、高度、整体重量、去壳后重量、脏器重量、壳的重量和环数,最后一列为label

0
回复
ChunkitLau
#73 回复于2020-05

信用卡客户的默认数据集

摘要:这项研究针对客户的违约支付情况,并比较了六种数据挖掘方法中的违约概率的预测准确性。

https://aistudio.baidu.com/aistudio/datasetdetail/37088

0
回复
thinc
#74 回复于2020-05

数据集名称:心理咨询问答语料库

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/37106

数据集简介:

心理咨询问答语料库(以下也称为"数据集","语料库")是为应用人工智能技术于心理咨询领域制作的语料。据我们所知,这是心理咨询领域首个开放的 QA 语料库,包括 20,000 条心理咨询数据,也是公开的最大的中文心理咨询对话语料。数据集内容丰富,不但具备多轮对话内容,也有分类等信息,制作过程耗费大量时间和精力,比如标注过程是面向多轮对话,平均每条标记耗时 1 分钟。

0
回复
ChunkitLau
#75 回复于2020-05

Facebook Comment Volume数据集

摘要:该数据集中的实例包含从facebook帖子中提取的特征。与数据相关的任务是预测帖子将收到多少评论。

https://aistudio.baidu.com/aistudio/datasetdetail/37324

0
回复
thinc
#76 回复于2020-05

数据集名称:星巴克门店信息

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/37409

数据集简介:该数据集囊括了截至2017/2月份全球星巴克门店的基础信息

0
回复
ChunkitLau
#77 回复于2020-05

AAAI 2014接受论文数据集

https://aistudio.baidu.com/aistudio/datasetdetail/37476

0
回复
thinc
#78 回复于2020-05

数据集名称:欺诈交易检测

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/37557

数据集简介:

在法律上,欺诈是故意欺骗,以确保获得不公平或非法收益,或剥夺受害者合法权利。
欺诈可能违反民法(即欺诈受害者可能起诉欺诈者以避免欺诈或追回金钱赔偿),刑法(即欺诈者可能会受到政府当局的起诉和监禁)或可能导致金钱,财产或法律权利的损失,但仍然是另一种民事或刑事错误的组成部分

0
回复
thinc
#79 回复于2020-05

数据集名称:肯德基早餐

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/37617

数据集简介:进行数据分析,来搭配出自己的营养早餐吧~

0
回复
legendxty
#80 回复于2020-05

自己标注的小型数据集-纸盒子,用于检测纸盒子的区域和四个顶点位置,纸盒子分为大中小三个尺寸。

https://aistudio.baidu.com/aistudio/datasetdetail/37170

0
回复
ChunkitLau
#81 回复于2020-05

道琼斯指数数据集

https://aistudio.baidu.com/aistudio/datasetdetail/37620

0
回复
ChunkitLau
#82 回复于2020-05

2.4 GHZ室内通道测量数据集

https://aistudio.baidu.com/aistudio/datasetdetail/37748

0
回复
thinc
#83 回复于2020-05

数据集名称:猫狗jpg图像

数据集链接:https://aistudio.baidu.com/aistudio/datasetdetail/37855

数据集简介:包含12500张猫和12500张狗的jpg格式图片,可用于图像分类

0
回复
ChunkitLau
#84 回复于2020-05

3D道路网络(丹麦北日德兰半岛)数据集

https://aistudio.baidu.com/aistudio/datasetdetail/37874

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户