我已经阅读了很多论坛,没有明确的答案。他们说,在许多地方,它会从数据中为我们的示例选择最后20%。在两个文件夹Cats and Dogs中说我们的数据...因此,如果只从Dogs文件夹中选择最后20%的数据,而从cats文件夹中选择一个数据,那会错吗? 。 keras真的可以在此代码中犯这样的错误吗?您能否确保由keras选择进行验证的数据具有来自每个类的相同比例的图像。
datagen = ImageDataGenerator(rescale=1./255, validation_split=0.2)
print("Preparing training dataset...")
train_generator = datagen.flow_from_directory(
training_folder_name,
target_size=pretrained_size,
batch_size=batch_size,
class_mode='categorical',
subset='training') # set as training data
print("Preparing validation dataset...")
validation_generator = datagen.flow_from_directory(
training_folder_name,
target_size=pretrained_size,
batch_size=batch_size,
class_mode='categorical',
subset='validation') # set as validation data
输出:正在准备训练数据集...找到3357个属于3类的图像正在准备验证数据集...找到属于3类的838张图像。
[这838个图像在每个类别中都有相等的分数?
如果对猫和狗进行分类,验证集是否必须包括猫和狗?是。验证集实际包括的内容取决于您实施程序的方式,这不是Keras的责任。