我想训练一个卷积神经网络来检测图像的正确方向。仅 4 度(0、90、180 和 270)。
难点在于:图像会包含不同的物体——单个人、一群人、山景、建筑物等等......
我正在考虑在一大组图像上训练卷积网络。每个图像将旋转 4 次(0、90、180 和 270)。每个图像都会有一个标签 (0 -> 0, 90 -> 1, 180 -> 2, 270 -> 3)。
还有其他方向 CNN/复杂 4 类 CNN/RNN 的示例可供我参考吗? (我使用的是Caffe框架)
我同意您的观察,即查看照片中的特定物体并使用它们的方向来决定图像方向可能会产生误导。 例如检查此图像:
方向完美,但脸部不直立。
因此,我认为您将此问题视为图像标签问题(即每个输入图像的单方向标签)的方法是一个好方法。 我会采用任何不太花哨的现成网络,并根据您建议的标签对其进行微调。