我有一项特定任务,需要从 PDF 和图像文件中提取图章。然而,挑战在于每个文件中的标记并不始终位于同一区域。不同文档中印章的位置差异很大,因此高效自动化提取过程具有挑战性。
我尝试通过应用阈值和轮廓检测等技术来预处理文件。其背后的想法是通过检测图像中的轮廓来识别邮票的边界,然后在这些区域周围创建边界框。
我该如何进行?先感谢您。 这些是示例图像,有多个图像,并且印章位置各不相同 () ()
《法律手册》非常明确地指出,这些印章应该受到控制,因为如果不受控制,可能会受到处罚。
无论如何,最好的方法是使用干净的 CV 来训练 CV 到底要匹配什么对象。