我有一个包含以下文件的文件夹:train.idx,train.rec,属性,lfw.bin,cfp_fp.bin,agedb_30.bin
此文件夹包含面部图像。
我已经在以下代码中使用ImageRecordIter。
但是,每次打印train_data的第一个元素时,都会得到不同的图像。
train_data = ImageRecordIter(
path_imgrec = os.path.join(rec_path,'train.rec'),
path_imgidx = os.path.join(rec_path, 'train.idx'),
label_width = 2,
data_shape = (3,112,112 ),
batch_size = 10,
shuffle = False)
我的问题是:
1)我不知道通常如何将数据存储在这些类型的文件中,例如哪个包含标签。对这些类型的文件有任何想法吗?
2)如何提取一部分数据来制作样本文件?另外,文件格式是什么(例如,泡菜文件,txt文件)?
您仅在train.rec
中使用train.idx
和ImageRecordIter
,因此它们是唯一使用的文件。您的标签将(与数据一起)存储在train.rec
文件中。您可以使用MXIndexedRecordIO
从这些文件中提取随机样本。类似于:
MXIndexedRecordIO