对于5个类中的每一个,我有10000个RGB图像,18 * 18像素(是的,图像是小尺寸的)。我想制作深度学习模型,将图像分类为5个标签。我分别用内核(3,3)和(3,3,3)尝试了Conv2D和Conv3D。我尝试使用不同的过滤器(16,32,64,128,256)添加多个图层(最多8个)。我尝试了不同的激活器(relu,sigmoid)和优化器(adam,sgd)。我也试过#epochs高达500.然而,无论如何我无法获得超过0.5的整体准确度。请帮助我们如何提高准确性。
我建议你寻找像“mnist cnn”这样的好例子,并将该模型应用于你的数据集。
我认为你需要其他东西,而不仅仅是网络架构。
它可能在下面。
首先尝试增加每个类的数据样本(尝试收集真正的新数据后再增加它们)尽管你的数据与使用最先进的预训练模型(如移动网络)的imagenet类不相似v2或Xceptoin)作为初始权重并根据您的数据对其进行微调,如果您的样本与imagenet类似,则可以冻结第一层,并仅在模型末尾训练密集层。