在fastai库中使用download_data()和untar_data()

问题描述 投票:1回答:1

我使用fastai库中的dowload_data()函数从kaggle下载了Fashion MNIST数据集。

downloaded_data = download_data("https://www.kaggle.com/zalando-research/fashionmnist/download")

输出-

PosixPath('/root/.fastai/data/download.tgz')

download_data将其另存为.tgz文件,现在我使用untar_data()。

path = untar_data('/root/.fastai/data/download.tgz')

输出-

PosixPath('/root/.fastai/data/download.tgz')

没有提取.tgz文件。如何在fastai库中使用此数据集?

python-3.x image-processing deep-learning fast-ai
1个回答
1
投票

在fastai库中,download_data提供的是pathlib.PosixPath文件,而不是确切的文件,您需要使用其他解压缩库来提取数据。

如果您只需要快速AI的MNIST数据,这是一种更简单的方法:

MNIST_URL='http://deeplearning.net/data/mnist/mnist.pkl'
path = datasets.download_data(MNIST_URL, ext='.gz')
with gzip.open(path, 'rb') as f:
    ((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding='latin-1')
© www.soinside.com 2019 - 2024. All rights reserved.