Python 和 OpenCV - 查找表单中手写文本的轮廓和坐标

问题描述 投票:0回答:1

我有扫描文档的样本。该文件是表格(欧洲事故陈述),我想检测手写文本并绘制手写文本的轮廓。

第一张图片是我的原始文档:

我想检测所有手写文本并在其上绘制边界框,如下所示:

我已经尝试使用 boxdetect 但没有成功 检测文档中的所有字段后,期望的结果应该是用户需要填写的所有字段的坐标,例如:

|      Name           |        Vorname     |      Telefon
|---------------------|--------------------|----------------------
|[(101, 172, 63, 12)] |[(105, 177, 69, 18)]| [(109, 182, 74, 23)]
python opencv machine-learning computer-vision ocr
1个回答
1
投票

如果表格几乎完全相同,您可以扫描空白表格并从书面表格中减去该表格。然后您可以应用阈值和其他一些处理来创建二进制掩码。

这是我在几分钟内创建的东西:

代码大致如下:

import numpy as np

difference = np.abs(written_form.astype(np.int16)-base_form.astype(np.int16))
text_mask = np.all(difference > 100, axis=2)
© www.soinside.com 2019 - 2024. All rights reserved.