Python hdf5storage是转置我的数据?

问题描述 投票:1回答:1

Python代码:

import h5py
import hdf5storage
from functools import reduce
import numpy as np
from operator import mul

sz = 128,256,512
a = np.random.normal(size=reduce(mul,sz)).reshape(sz)
save_dict = {'data':a}

spath = r"test.mat"
hdf5storage.savemat(spath, mdict=save_dict, append_mat=False, 
                    store_python_metadata=True, format='7.3')

with h5py.File(spath, 'r') as file:
    b = np.array(file['data'])

# Reads in the correct shape, but is F-contiguous. Scipy doesn't work with v7.3 files.
c = hdf5storage.loadmat(spath)['data']

创建a时,它具有形状(128,256,512)。但是,当我使用hdf5storage将a保存到.mat文件,然后使用h5py将其加载到b时,b的转置形状为(512,256,128)。检查标志时,两个数组都是C连续的。

有没有办法防止这种转置发生?我的印象是hdf5格式保存了行专业。

python hdf5 h5py hdf5storage
1个回答
2
投票

我再次看了下面描述的abc.h5文件:

how to import .mat-v7.3 file using h5py

它是在Octave中创建的:

>> A = [1,2,3;4,5,6];
>> B = [1,2,3,4];
>> save -hdf5 abc.h5 A B

使用h5py

In [102]: f = h5py.File('abc.h5','r')
In [103]: A = f['A']['value'][:]
In [104]: A
Out[104]: 
array([[1., 4.],
       [2., 5.],
       [3., 6.]])
In [105]: A.shape
Out[105]: (3, 2)
In [106]: A.flags
Out[106]: 
  C_CONTIGUOUS : True
  F_CONTIGUOUS : False
  ...
In [107]: A.ravel()
Out[107]: array([1., 4., 2., 5., 3., 6.])

所以它是一个转置的C阶数组。显然,这是MATLAB开发人员选择将其矩阵存储在HDF5中的方式。

我可以把它转换成numpy:

In [108]: At = A.T
In [109]: At
Out[109]: 
array([[1., 2., 3.],
       [4., 5., 6.]])
In [110]: At.flags
Out[110]: 
  C_CONTIGUOUS : False
  F_CONTIGUOUS : True
  ....

正常情况下,C次序阵列在转置时变为F次序。

Octave矩阵使用较旧的.mat格式保存

In [115]: data = io.loadmat('../abc.mat')
In [116]: data['A']
Out[116]: 
array([[1., 2., 3.],
       [4., 5., 6.]])
In [117]: _.flags
Out[117]: 
  C_CONTIGUOUS : False
  F_CONTIGUOUS : True

因此,转换的h5py数组符合io.loadmat已经使用了相当长一段时间的惯例。

我没有在这个操作系统上安装hdf5storage。但是通过你的测试,它遵循io.loadmat惯例 - 正确的形状,但F顺序。

© www.soinside.com 2019 - 2024. All rights reserved.