共计 1568 个字符,预计需要花费 4 分钟才能阅读完成。
导读 | 这篇文章主要为大家介绍了 python 深度学习 tensorflow 实例数据下载与读取示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪 |
深度学习的入门实例,一般就是 mnist 手写数字分类识别,因此我们应该先下载这个数据集。
tensorflow 提供一个 input_data.py 文件,专门用于下载 mnist 数据,我们直接调用就可以了,代码如下:
import tensorflow.examples.tutorials.mnist.input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
执行完成后,会在当前目录下新建一个文件夹 MNIST_data, 下载的数据将放入这个文件夹内。下载的四个文件为:
input_data 文件会调用一个 maybe_download 函数,确保数据下载成功。这个函数还会判断数据是否已经下载,如果已经下载好了,就不再重复下载。
下载下来的数据集被分三个子集:5.5W 行的训练数据集(mnist.train),5 千行的验证数据集(mnist.validation) 和 1W 行的测试数据集(mnist.test)。因为每张图片为 28×28 的黑白图片,所以每行为 784 维的向量。
每个子集都由两部分组成:图片部分(images) 和标签部分 (labels), 我们可以用下面的代码来查看:
print mnist.train.images.shape
print mnist.train.labels.shape
print mnist.validation.images.shape
print mnist.validation.labels.shape
print mnist.test.images.shape
print mnist.test.labels.shape
如果想在 spyder 编辑器中查看具体数值,可以将这些数据提取为变量来查看,如:
val_data=mnist.validation.images
val_label=mnist.validation.labels
除了 mnist 手写字体图片数据,tf 还提供了几个 csv 的数据供大家练习,存放路径为:
/home/xxx/anaconda3/lib/python3.5/site-packages/tensorflow/contrib/learn/python/learn/datasets/data/text_train.csv
如果要将这些数据读出来,可用代码:
import tensorflow.contrib.learn.python.learn.datasets.base as base
iris_data,iris_label=base.load_iris()
house_data,house_label=base.load_boston()
前者为 iris 鸢尾花卉数据集, 后者为波士顿房价数据。
tf 提供了 cifar10 数据的下载和读取的函数,我们直接调用就可以了。执行下列代码:
import tensorflow.models.image.cifar10.cifar10 as cifar10
cifar10.maybe_download_and_extract()
images, labels = cifar10.distorted_inputs()
print images
print labels
就可以将 cifar10 下载并读取出来。
以上就是 python 深度学习 tensorflow 实例数据下载与读取的详细内容。