我想构建一个应用程序来识别壁纸上使用的表情符号。
例如,这个应用程序将接收输入:
输出时应返回识别表情符号的名称数组:
[
"Smiling Face with Sunglasses",
"Grinning Face with Smiling Eyes",
"Kissing Face with Closed Eyes"
]
我准备了由各个表情符号组成的训练数据。 例如,我将每个表情符号旋转了 30 度、将其切成一半等等。
训练模型后,平均精度为
0.8
,这相当不错,但它只适用于每个壁纸一个表情符号。如果我在一张壁纸上上传多种类型的表情符号,它无法识别任何对象。
我的问题是:为什么它可以识别每个壁纸一种类型的表情符号,但如果我在一张壁纸上放置多种类型的表情符号,它就不起作用?
我正在使用 Google ML Vision,并且我选择了
Multi-Label Classification
作为数据集。
是的,如果我没记错的话,它类似于对象检测,它需要先检测表情符号然后识别它。同样,在使用模板检测的车牌号检测中,有时会出现仅在有一个物体时才检测到的情况,而如果有多个车辆则无法检测到。所以我建议查看类似识别的代码。它也可以帮助您理解代码。