如题:
在本地’./work/'目录下读取文件名称为’mnist.json.gz’的MINST数据,并拆分成训练集、验证集和测试集,代码如下所示。# 声明数据集文件位置datafile = './work/mnist.json.gz'print('loading mnist dataset from {} ......'.format(datafile))
mnist的数据不是如下格式么?哪来的mnist.json.gz?
t10k-images-idx3-ubyte.gz
t10k-labels-idx1-ubyte.gz
...
可否贴一下链接?
如果想用mnist数据集可以用
paddle.dataset.mnist.train()和paddle.dataset.mnist.test()
参考链接:https://www.paddlepaddle.org.cn/documentation/api/zh/0.12.0/data/dataset.html#mnist
例子在这https://www.paddlepaddle.org.cn/tutorials/projectdetail/397425
例子在这:https://www.paddlepaddle.org.cn/tutorials/projectdetail/397425
在aistudio的这个项目里有。启动进入后,在左侧文件夹路径:data/data17155/mnist.json.gz,或数据集目录下就有mnist.json.gz:
https://aistudio.baidu.com/aistudio/projectdetail/232730
找到了,灰常感谢
你好,我正在入门paddle,四处找不到mnist.json.gz数据集文件,你的链接显示“设为私密状态”,能否提供一下这个文件啊?非常感谢了
你好,新手小白碰到同样问题,找不到mnist.json.gz文件,求帮助,谢谢
参考一下6楼的内容吧
谢谢您的回复。试过#6楼的方法,链接显示“设为私密状态”,无法访问啊
https://www.paddlepaddle.org.cn/tutorials/projectdetail/423042
该链接最上方有一个在线运行代码
https://aistudio.baidu.com/aistudio/datasetlist/2 搜索mnist 下面有json格式的
mnist手写字符用官方的方便。3楼正解。
注意内置的数据集读出的数据已经归一化了
paddle.batch( paddle.reader.shuffle(mnist_reader(paddle.dataset.mnist.train()), 30000), batch_size=BATCH_SIZE)
这几个函数配合,就实现了异步读取数据、shuffle、划分batch了,很方便
函数的参数可以查阅api文档
https://www.paddlepaddle.org.cn/documentation/docs/zh/api_cn/io_cn/batch_cn.html#batch
对,官方的已经帮你整理好了
2.0版本的dataset接口会有更多的数据
嗯,会加入fashion mnist等
以前的api其实也有数据集,但是不太好找
13 楼回复为正解,可以下载到数据集。
又找不到了,有谁能提供一下 mnist.json.gz 吗?
可否贴一下链接?
如果想用mnist数据集可以用
paddle.dataset.mnist.train()和paddle.dataset.mnist.test()
参考链接:https://www.paddlepaddle.org.cn/documentation/api/zh/0.12.0/data/dataset.html#mnist
例子在这https://www.paddlepaddle.org.cn/tutorials/projectdetail/397425
例子在这:https://www.paddlepaddle.org.cn/tutorials/projectdetail/397425
在aistudio的这个项目里有。启动进入后,在左侧文件夹路径:data/data17155/mnist.json.gz,或数据集目录下就有mnist.json.gz:
https://aistudio.baidu.com/aistudio/projectdetail/232730
找到了,灰常感谢
你好,我正在入门paddle,四处找不到mnist.json.gz数据集文件,你的链接显示“设为私密状态”,能否提供一下这个文件啊?非常感谢了
你好,新手小白碰到同样问题,找不到mnist.json.gz文件,求帮助,谢谢
参考一下6楼的内容吧
谢谢您的回复。试过#6楼的方法,链接显示“设为私密状态”,无法访问啊
https://www.paddlepaddle.org.cn/tutorials/projectdetail/423042
该链接最上方有一个在线运行代码
https://aistudio.baidu.com/aistudio/datasetlist/2 搜索mnist 下面有json格式的
mnist手写字符用官方的方便。3楼正解。
注意内置的数据集读出的数据已经归一化了
paddle.batch( paddle.reader.shuffle(mnist_reader(paddle.dataset.mnist.train()), 30000), batch_size=BATCH_SIZE)
这几个函数配合,就实现了异步读取数据、shuffle、划分batch了,很方便
函数的参数可以查阅api文档
https://www.paddlepaddle.org.cn/documentation/docs/zh/api_cn/io_cn/batch_cn.html#batch
对,官方的已经帮你整理好了
2.0版本的dataset接口会有更多的数据
嗯,会加入fashion mnist等
以前的api其实也有数据集,但是不太好找
13 楼回复为正解,可以下载到数据集。
又找不到了,有谁能提供一下 mnist.json.gz 吗?