首页 Paddle框架 帖子详情
飞桨例子里面的mnist.json.gz去哪下载
收藏
快速回复
Paddle框架 问答深度学习炼丹技巧 6995 25
飞桨例子里面的mnist.json.gz去哪下载
收藏
快速回复
Paddle框架 问答深度学习炼丹技巧 6995 25

如题:

在本地’./work/'目录下读取文件名称为’mnist.json.gz’的MINST数据,并拆分成训练集、验证集和测试集,代码如下所示。
# 声明数据集文件位置
datafile = './work/mnist.json.gz'
print('loading mnist dataset from {} ......'.format(datafile))

 

mnist的数据不是如下格式么?哪来的mnist.json.gz?

t10k-images-idx3-ubyte.gz

t10k-labels-idx1-ubyte.gz

...

 

2
收藏
回复
全部评论(25)
时间顺序
thinc
#2 回复于2020-05

可否贴一下链接?

0
回复
thinc
#3 回复于2020-05

如果想用mnist数据集可以用

paddle.dataset.mnist.train()paddle.dataset.mnist.test()

参考链接:https://www.paddlepaddle.org.cn/documentation/api/zh/0.12.0/data/dataset.html#mnist

0
回复
H
HeartIsBeat
#4 回复于2020-05

例子在这https://www.paddlepaddle.org.cn/tutorials/projectdetail/397425

 

0
回复
H
HeartIsBeat
#5 回复于2020-05
thinc #3
如果想用mnist数据集可以用 paddle.dataset.mnist.train()和paddle.dataset.mnist.test() 参考链接:https://www.paddlepaddle.org.cn/documentation/api/zh/0.12.0/data/dataset.html#mnist
展开

例子在这:https://www.paddlepaddle.org.cn/tutorials/projectdetail/397425

 

0
回复
HolliZhao
#6 回复于2020-05

在aistudio的这个项目里有。启动进入后,在左侧文件夹路径:data/data17155/mnist.json.gz,或数据集目录下就有mnist.json.gz:

https://aistudio.baidu.com/aistudio/projectdetail/232730

0
回复
H
HeartIsBeat
#7 回复于2020-05
在aistudio的这个项目里有。启动进入后,在左侧文件夹路径:data/data17155/mnist.json.gz,或数据集目录下就有mnist.json.gz: https://aistudio.baidu.com/aistudio/projectdetail/232730
展开

找到了,灰常感谢

0
回复
d
darrenao
#8 回复于2020-05
在aistudio的这个项目里有。启动进入后,在左侧文件夹路径:data/data17155/mnist.json.gz,或数据集目录下就有mnist.json.gz: https://aistudio.baidu.com/aistudio/projectdetail/232730
展开

你好,我正在入门paddle,四处找不到mnist.json.gz数据集文件,你的链接显示“设为私密状态”,能否提供一下这个文件啊?非常感谢了

1
回复
d
darrenao
#9 回复于2020-05

你好,新手小白碰到同样问题,找不到mnist.json.gz文件,求帮助,谢谢

0
回复
thinc
#10 回复于2020-05
你好,新手小白碰到同样问题,找不到mnist.json.gz文件,求帮助,谢谢

参考一下6楼的内容吧

0
回复
d
darrenao
#11 回复于2020-05
thinc #10
参考一下6楼的内容吧

谢谢您的回复。试过#6楼的方法,链接显示“设为私密状态”,无法访问啊

0
回复
thinc
#12 回复于2020-05
darrenao #11
谢谢您的回复。试过#6楼的方法,链接显示“设为私密状态”,无法访问啊

https://www.paddlepaddle.org.cn/tutorials/projectdetail/423042

该链接最上方有一个在线运行代码

0
回复
w
wanghao_kjlink
#13 回复于2020-10

https://aistudio.baidu.com/aistudio/datasetlist/2  搜索mnist 下面有json格式的

3
回复
AIStudio810258
#14 回复于2020-10
你好,新手小白碰到同样问题,找不到mnist.json.gz文件,求帮助,谢谢

mnist手写字符用官方的方便。3楼正解。

注意内置的数据集读出的数据已经归一化了

0
回复
AIStudio810258
#15 回复于2020-10

paddle.batch( paddle.reader.shuffle(mnist_reader(paddle.dataset.mnist.train()), 30000), batch_size=BATCH_SIZE)

这几个函数配合,就实现了异步读取数据、shuffle、划分batch了,很方便

0
回复
AIStudio810258
#16 回复于2020-10
paddle.batch( paddle.reader.shuffle(mnist_reader(paddle.dataset.mnist.train()), 30000), batch_size=BATCH_SIZE) 这几个函数配合,就实现了异步读取数据、shuffle、划分batch了,很方便
展开

函数的参数可以查阅api文档

https://www.paddlepaddle.org.cn/documentation/docs/zh/api_cn/io_cn/batch_cn.html#batch

0
回复
thinc
#17 回复于2020-11
mnist手写字符用官方的方便。3楼正解。 注意内置的数据集读出的数据已经归一化了

对,官方的已经帮你整理好了

2.0版本的dataset接口会有更多的数据

0
回复
AIStudio810258
#18 回复于2020-11
thinc #17
对,官方的已经帮你整理好了 2.0版本的dataset接口会有更多的数据

嗯,会加入fashion mnist等

0
回复
thinc
#19 回复于2020-11
嗯,会加入fashion mnist等

以前的api其实也有数据集,但是不太好找

0
回复
zhaowenduo2012
#20 回复于2020-12

13 楼回复为正解,可以下载到数据集。

0
回复
S
SATAN3506
#21 回复于2021-06

又找不到了,有谁能提供一下 mnist.json.gz 吗?

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户