图像识别可以处理类,其中决定质量不是直接可见的吗?

问题描述 投票:1回答:2

我有以下问题,我不太确定它是否可以通过图像识别(和卷积神经网络)解决。

我有一个40万张图片的数据集,分为5个类。这些图片是应用程序的屏幕截图,根据他们收到的年龄等级将其放入5个类别。

例如:我有200k标记为0级,这意味着它们适合所有年龄段(根据年龄等级);我有50k图片标记为1级(适合6岁以上的儿童),依此类推。

有了这些数据,我想训练一个神经网络,可以告诉我,截图(以及相应的游戏)可能具有哪个年龄等级。

这是一个可以通过图像识别来管理的问题吗?

我已经查看了用于图像识别的示例(主要是Keras教程),并且所有这些示例都处理了明显可见的问题(例如“图像是显示猫还是狗”)。通过浏览我的数据集,我意识到,有些图片非常相似,但属于不同的类。

卷积神经网络(或任何其他类型的图像识别算法)可以处理类,其中决定因素不是直接可见的吗?这只是网络有多深的问题吗?

如果有人能指出我在哪里寻找更多信息,我会非常感激。

python keras image-recognition
2个回答
1
投票

它可能也可能不会。对于CNN在没有上下文输入的情况下提供良好结果,这意味着输入和输出之间必须存在一些相关性。因此,假设一些应用程序的设计与年龄等级相关,那么是可能的,否则它不会,除非您给网络提供更多的东西。

这实际上可以让你进行一个很酷的实验来检查自己,通过一些普通的CNN来运行它,如果它评估得很好(通过交叉验证)那么你可能已经证明存在相关性

(注意:如果模型测试不好,那不是证据表明相关性不存在,可能不太可能,但不能保证)


0
投票

是的,原则上这是可以管理的。您正在寻找的输出层称为softmax图层。它评估每个类的概率,并选择最可能的类。

由于“不直接可见”,我想你的意思是“对人类专家来说并不明显”。嗯,这正是机器学习的关键所在。近年来,图像分类中的算法advanced quite a lot。但是不能保证成功。 NN可以发现的变量之间需要有一些真正的相关性。

正如@mshlis所指出的:上下文与您的图像一起可能会改善您的结果(即开发人员工作室,整个应用程序的大小,图形数据的大小,或任何可能作为预测年龄评级的指标)

© www.soinside.com 2019 - 2024. All rights reserved.