我在二进制CNN中执行了数据扩充。在我的原始数据集中,我有1400张图像(每个类700张),因此,我的疑问是,当我实现数据增强(如下)时,此方法在我的数据集中添加了多少张图像?
datagen = ImageDataGenerator(
rotation_range=30,
zoom_range=0.15,
featurewise_std_normalization=True,
width_shift_range=0.2,
height_shift_range=0.2,
shear_range=0.15,
horizontal_flip=True,
fill_mode="nearest")
Keras ImageDataGenerator不会将图像添加添加到数据集中,它只是随机修改来自数据集中的图像(需要时)。每次要求批量处理时,它将从数据集中选择几个未修改的图像,然后对其进行修改。因为它执行随机修改,所以可以对任何给定的原始图像进行几乎无限数量的变化。
[如果您有1400张图像,假设您获得90%的验证准确性。如果对它们执行增强,则可能会得到93%。但是,请记住,扩充不是很好的替代较大数据集的方法。如果您再收集1400张图像,那么即使不进行任何扩充也可能获得95%的图像。发生这种情况是因为新图像是全新的,因此它们可能具有无法通过标准增强功能添加的功能。