如何将图像文件夹转换为h5文件?或者是否有不同类型的文件格式用于将数据集输入 CNN 模型?
提前谢谢您。
您可以将每个文件(即图像)存储为数据类型
opaque
的 HDF5 数据集。此外,对于每个数据集,您可以关联一个或多个属性来描述文件(例如创建时间戳)。
在Python中使用HDFql,可以按如下方式实现:
import HDFql
HDFql.execute("CREATE AND USE FILE images.h5") # create HDF5 file named 'images.h5' and use (i.e. open) it
HDFql.execute("SHOW FILE my_directory/") # get files (i.e. images) stored in directory 'my_directory' and populate cursor with result
i = 1
while HDFql.cursor_next() == HDFql.SUCCESS: # loop through cursor
file_name = HDFql.cursor_get_char()
dataset_name = "dataset_%04d" % i
HDFql.execute("CREATE DATASET %s VALUES FROM BINARY FILE \"%s\"" % (dataset_name, file_name)) # create HDF5 dataset and write data from file into it
i = i + 1