有没有任何OCR或技术可以识别/识别以pdf文档形式打印的单选按钮?

问题描述 投票:0回答:1

我有一个 pdf 文档,其中包含无线电响应,如所附屏幕截图。我只想通过 python 或任何 OCR 技术提取所选响应。有什么办法可以做到吗? (https://i.stack.imgur.com/3fXu6.png)

我尝试过 pdfplumber、pdfminer、pytesseract,但它们无法仅提取响应。

python nlp ocr large-language-model information-extraction
1个回答
0
投票

“尝试 Azure 文档智能。它们有一个称为布局分析的功能,您可以在其中提取文本和单选按钮。

https://learn.microsoft.com/en-gb/azure/ai-services/document-intelligence/concept-layout?view=doc-intel-4.0.0"

© www.soinside.com 2019 - 2024. All rights reserved.