扫描并阅读带有复选框的文档

问题描述 投票:0回答:2

我收到一位顾客的请求,希望为不同地区的老人提供膳食。为此,人们填写一周的表格,并根据每天的选择勾选方框(还考虑到特定要求)。

例如:

 Name
 Commune

                  With salt ( )      Without salt []

Mon :       Meal 1 ( )                   Meal 2 ( )
           Dessert 1 ( )                 Dessert ( )

Tues :       Meal 1 ( )                   Meal 2 ( )
           Dessert 1 ( )                 Dessert ( )

然后应汇总每张表中的数据,以告诉我们每个公社每天需要准备多少种膳食......

表格都是一样的,所以我希望能够扫描进去并自动读取它们。

我不知道有什么软件可以让我做到这一点。完成这项任务的最佳方法是什么?目前我正在研究超正方体,但也许有一些更简单的技术?

编辑:我们正在谈论每周数百份表格。理想情况下,我们会同时扫描它们,提取数据并以电子方式存储表格。

ocr
2个回答
11
投票

您正在寻找的不是 OCR,这意味着读取机器打印的字符。您正在寻找 ICR/OMR 软件,也称为表单处理或数据捕获。 OMR 代表光学标记识别,这就是您正在尝试做的,识别复选标记/复选框的值。

有关手写识别的其他信息如下: ICR 用于机器打印文本?

因为您的表单是相同的,这意味着您的表单属于“固定表单”类别,并且基于模板的软件包可以处理这些表单。这是一个简短的文档,解释了表单类型之间的差异: www.wisetrend.com/files/Structured_vs_Semi-Structured.pdf

您的空白表格本身也应该设计得适合机器识别。它应该有参考标记,以便更好地对齐模板,清晰的流程,以便用户知道如何自然地填写它,适当大小的复选框等。

我相信 FlexiCapture 会满足您所需的一切:链接。至少有几种其他解决方案可以执行类似的过程。我担任纸质表单处理项目的集成商/顾问。

我删除了您的“移动”标签,因为我相信您不打算使用手机来拍摄这些图像。如果您是这样,如果您有其他选择,我会建议您不要这样做。您提到使用传统扫描仪扫描它们,这是获得良好图像质量的最佳选择。相信我,在处理人类手写表单时,您将有足够的事情要处理,因此请尽可能优化您的表单、扫描、软件和流程。

如果您有兴趣自己开发,也是可以的。该过程是将图像区域(每个复选标记)与某些“基线”进行比较,以查看该区域是否有其他手写内容。如果超过某个阈值,则已检查复选标记。典型问题是区域对齐和边界阈值水平(小/浅刻度线)。商业包会自动处理该问题。

如果您需要任何额外指导,请告诉我。

伊利亚·埃夫多基莫夫


0
投票

10 年过去了,让我用最新的发展来更新这个答案。我们现在有了 ChatGPT,我用它来扫描手写纸质表格。它在识别表单中的手写字符时表现得很好。我会再次猜测一些不好的笔迹,但是OpenAI Vision API可以解决并准确识别书写的单词/字母。

我面临的只有一个问题,那就是阅读复选框。大约 80% 的时间它能够正确读取复选框,但我不明白为什么它在其余时间会出错。

© www.soinside.com 2019 - 2024. All rights reserved.