图像识别可以处理类，其中决定质量不是直接可见的吗？

我有以下问题，我不太确定它是否可以通过图像识别（和卷积神经网络）解决。

我有一个40万张图片的数据集，分为5个类。这些图片是应用程序的屏幕截图，根据他们收到的年龄等级将其放入5个类别。

例如：我有200k标记为0级，这意味着它们适合所有年龄段（根据年龄等级）;我有50k图片标记为1级（适合6岁以上的儿童），依此类推。

有了这些数据，我想训练一个神经网络，可以告诉我，截图（以及相应的游戏）可能具有哪个年龄等级。

这是一个可以通过图像识别来管理的问题吗？

我已经查看了用于图像识别的示例（主要是Keras教程），并且所有这些示例都处理了明显可见的问题（例如“图像是显示猫还是狗”）。通过浏览我的数据集，我意识到，有些图片非常相似，但属于不同的类。

卷积神经网络（或任何其他类型的图像识别算法）可以处理类，其中决定因素不是直接可见的吗？这只是网络有多深的问题吗？

如果有人能指出我在哪里寻找更多信息，我会非常感激。

1
投票

它可能也可能不会。对于CNN在没有上下文输入的情况下提供良好结果，这意味着输入和输出之间必须存在一些相关性。因此，假设一些应用程序的设计与年龄等级相关，那么是可能的，否则它不会，除非您给网络提供更多的东西。

这实际上可以让你进行一个很酷的实验来检查自己，通过一些普通的CNN来运行它，如果它评估得很好（通过交叉验证）那么你可能已经证明存在相关性

（注意：如果模型测试不好，那不是证据表明相关性不存在，可能不太可能，但不能保证）

0
投票

是的，原则上这是可以管理的。您正在寻找的输出层称为softmax图层。它评估每个类的概率，并选择最可能的类。

由于“不直接可见”，我想你的意思是“对人类专家来说并不明显”。嗯，这正是机器学习的关键所在。近年来，图像分类中的算法advanced quite a lot。但是不能保证成功。 NN可以发现的变量之间需要有一些真正的相关性。

正如@mshlis所指出的：上下文与您的图像一起可能会改善您的结果（即开发人员工作室，整个应用程序的大小，图形数据的大小，或任何可能作为预测年龄评级的指标）