人工智能用于识别壁纸上的表情符号

Question

我想构建一个应用程序来识别壁纸上使用的表情符号。

例如，这个应用程序将接收输入：

输出时应返回识别表情符号的名称数组：

[
  "Smiling Face with Sunglasses", 
  "Grinning Face with Smiling Eyes", 
  "Kissing Face with Closed Eyes"
]

我准备了由各个表情符号组成的训练数据。例如，我将每个表情符号旋转了 30 度、将其切成一半等等。

训练模型后，平均精度为

0.8

，这相当不错，但它只适用于每个壁纸一个表情符号。如果我在一张壁纸上上传多种类型的表情符号，它无法识别任何对象。

我的问题是：为什么它可以识别每个壁纸一种类型的表情符号，但如果我在一张壁纸上放置多种类型的表情符号，它就不起作用？

我正在使用 Google ML Vision，并且我选择了

Multi-Label Classification

作为数据集。

Answer 1

是的，如果我没记错的话，它类似于对象检测，它需要先检测表情符号然后识别它。同样，在使用模板检测的车牌号检测中，有时会出现仅在有一个物体时才检测到的情况，而如果有多个车辆则无法检测到。所以我建议查看类似识别的代码。它也可以帮助您理解代码。