我想将在线拼字游戏的截图解析为数据结构,这样我就可以通过求解器运行它来获得最佳移动。我没有计算机视觉方面的经验,但通过大学课程有一些ML的基本知识。任何想法,将不胜感激!
我试过google围绕“如何解析游戏图像”和相关主题,我有一些使用OCR库的经验,但最困难的部分是以某种方式知道如何分割图像,因此OCR可以确定字符。
我想了一下你的问题。这里的主要目标是找到所有网格案例之间的水平和垂直空隙。
这是通过在图像中传递水平梯度而获得的图像。
在这里,我评论说,不包含垂直边缘的表壳之间的水平线显示为全黑。因此,找到它们的方法是逐行计算此图像的平均值,并采用最低值。
这是通过计算这个逐行平均值得到的图:
由于第二张图片,我仍在努力分割所有行。