我有一些数据需要预处理,以便在3D卷积网络中进行后续步骤。数据以以下格式存储:
POSITION
x y z (feature 1 x) (feature 1 y) (feature 1 z) (feature 2 x) (feature 2 y ...
1.2 0.54 2.3 0.04 0.2 -0.9 -0.2 0.65 ...
...(more rows of the same format)...
并且经过一些涉及对位置数据和特征进行操作的其他步骤之后,我得到了尺寸为[height][width][depth][features]
的pytorch张量,或者等效为一个numpy数组,其中前三个是我可以用来绘制特征的位置数据[features]
是包含每个特征值的向量。
这些都是很大的文件,在处理过程中,我不想在以后从上面显示的第一种文件格式转换为张量/数组形式。我正在考虑使用torch.save(tensor, 'file.pt')
。
我的问题是:保存此数据的最佳文件格式是什么,以便以后无需进行任何预处理即可轻松访问?必须使用PyTorch对其进行序列化似乎是一种令人费解的保存数据类型的方法,我希望它具有更特定/指定的文件格式。
我想我已经找到了更直接的方法。 Numpy supports saving its arrays as a .npy
file.
该过程非常简单。要将数组.npy
保存到文件array_1
中,您需要做的是:
numpy_array_1.npy
然后将其加载到np.save('numpy_array_1.npy', array_l)
:
array_2