如何从扫描的文档中提取垂直标签和值?

问题描述 投票:1回答:1

我正在制作一个文档解析器,它从文档中提取数据字段并以结构化方式存储它们。我的数据集中的每个字段都是水平的,易于提取。

enter image description here

但是例如,该模型在垂直字段上失败,我想从此类图像中提取发票编号和日期,而这是任何类型的预先训练的OCR都不可能的-

enter image description here

python machine-learning deep-learning data-mining text-classification
1个回答
0
投票

将png转换为pdf,然后使用pdf2txt.py -V

© www.soinside.com 2019 - 2024. All rights reserved.