无法使用python + h5py访问外部链接

问题描述 投票:2回答:1

最近我开始使用.hdf5文件,仍然无法弄清楚如何正确使用外部链接。

我有一些.hdf5文件。每个文件都具有相同的结构,例如相同的密钥和数据类型。我想将它们合并到一个文件中,但是每个文件使用不同的密钥将它们分开。

这是我做的:

myfile = h5py.File("/path_to_the_directory/merged_images.hdf5", 'w')
myfile['0.000'] = h5py.ExternalLink("img_000.hdf5", "/path_to_the_directory/images")
myfile['0.001'] = h5py.ExternalLink("img_001.hdf5", "/path_to_the_directory/images")
myfile.flush()

然后我尝试用以下内容阅读:

myfile = h5py.File("/path_to_the_directory/merged_images.hdf5", 'r')
keys = list(myfile.keys())
print(keys)
print(list(myfile[keys[0]]))

线print(keys)给了我['0.000', '0.001']。所以,我相信文件的结构是可以的。

接下来的行给了我一个例外:KeyError: "Unable to open object (unable to open external file, external link file name = 'img_000.hdf5')"

难道我做错了什么?文档非常差,我在那里找不到相关的用例。

python python-3.x hdf5 h5py hdf
1个回答
0
投票

问题是你正在混合路径。区分两种类型的路径很重要:

  • 文件路径(硬盘驱动器上的位置)。
  • 数据集路径:此路径是HDF5文件的内部路径,不依赖于存储文件的位置。

h5py.ExternalLink中提到的the documentation的语法是:

myfile['/path/of/link'] = h5py.ExternalLink('/path/to/file.hdf5', '/path/to/dataset')

因此,我想鼓励你使用relative file path作为ExternalLink。如果您这样做,那么即使您将文件集合移动到硬盘驱动器上的新位置(或将其提供给其他人),一切都将继续有效。

使用正确的路径,您的示例可以正常工作,如下所示。

请注意,为了说明我对相对文件路径的评论,我已经使数据集的所有路径都是绝对的(这些只是文件的内部路径,并且不依赖于文件存储在硬盘驱动器上的位置)而我保留了文件路径相对。

import h5py
import numpy as np

myfile = h5py.File('test_a.hdf5', 'w')
myfile['/path/to/data'] = np.array([0,1,2])
myfile.close()

myfile = h5py.File('test_b.hdf5', 'w')
myfile['/path/to/data'] = np.array([3,4,5])
myfile.close()

myfile = h5py.File('test.hdf5', 'w')
myfile['/a'] = h5py.ExternalLink('test_a.hdf5', '/path/to/data')
myfile['/b'] = h5py.ExternalLink('test_b.hdf5', '/path/to/data')
myfile.close()

myfile = h5py.File('test.hdf5', 'r')
keys = list(myfile.keys())
print(keys)
print(list(myfile[keys[0]]))
print(list(myfile[keys[1]]))
myfile.close()

打印(如预期):

['a', 'b']
[0, 1, 2]
[3, 4, 5]
© www.soinside.com 2019 - 2024. All rights reserved.