如何在Kofax扫描的PDF格式中获得cel值以表现出色

问题描述 投票:0回答:1

我是Kofax捕获新手,我正在从基本扫描发票副本(PDF)中检索数据,该表包含索引文件的项目列表。遵循的步骤如下:

  1. 创建文档类并添加类型表和表列的索引字段,例如Date as field。 PDF的日期列值截图如下:

enter image description here

  1. 在验证期间,日期字段值全部显示在一个字段中,如下所示:

Date: 12/01/2018 12/02/2018 12/03/2018 12/04/2018

  1. 当导出到索引文件的值采用上述格式时也是如此。

有没有办法在每个单元格中检索值作为单独的条目或使用kofax捕获分隔逗号?

ocr capture kofax
1个回答
0
投票

普通香草Kofax Capture(KC)无法提取表格中组织的数据。 KC可以提取静态数据,即简单的键值对(例如发票号,发票日期,总金额)。

当然,您可以尝试提取这样的列:enter image description here

但是,这可能导致潜在的问题。如果数据不总是在同一个地方怎么办?如果数据在后续页面上继续怎么办?您所在区域的内容小于整个列?如果有重叠的文本怎么办?如果您希望其他列具有其他数据,主要是创建行,但是如果某些列中存在巨大差距(如我的屏幕截图所示),该怎么办?

如果需要表提取,您可能需要使用Kofax Transformation Modules(KTM),它可作为Kofax Capture的附加组件使用。 KTM有更复杂的提取表格的方法,不仅限于单独的表格布局。

© www.soinside.com 2019 - 2024. All rights reserved.