ocr 相关问题

光学字符识别，通常缩写为OCR，是将手写，打字或打印文本的扫描图像机械或电子转换为机器编码文本。

将图像上的标题（文本）裁剪到特定边框（按颜色）

如何沿着下部红色背景的边框从图像中剪切标题（示例如下）？我正在计划一个批处理过程，即使用数百张具有不同标题的图像（都带有

bash image-processing imagemagick ocr crop

回答 1 投票 0

确定的 OCR 质量

我有一个低质量的英文PDF文件，没有图像，没有表格，单列，完全黑白 - 甚至没有灰色。我使用了 ABBYY FineReader，它检测到的文本很好，我可以海...

pdf ocr

回答 1 投票 0

如何提高PaddleOCR性能，有时无法检测单词之间的空格

我正在使用 paddleOCR 从日常使用的项目中提取数据，它在大多数情况下工作正常，但有时它会将两个或多个单词混合为一个单词，它不会占用空间......

ocr paddle-paddle paddleocr

回答 2 投票 0

获取 UnboundLocalError：在将 craft-text- detector 应用于 python 中的图像时，在赋值之前引用局部变量“img”

我正在尝试使用Python中的craft-text- detector获取图像作物。使用 craft-text- detector==0.4.3 torch==1.11.0 torchvision==0.12.0 numpy==1.23.0 代码： # 导入工艺函数来自 craft_text_de...

python ocr

回答 1 投票 0

Python 的 Tesseract - 奇怪的 OCR 结果 - 转换数字行但无法转换每个单独的数字

在 python 中使用 Tesseract 并得到不一致的 OCR 结果 - 它可以正确转换数字行，但无法转换每个单独的数字。例如，对于此图像 1 Tesseract 给出了正确的 r...

python ocr tesseract

回答 1 投票 0

如何链接 Kotlin 和 Python 项目？

我有一个带有 OCR、图像处理步骤的 python 项目。我想通过将我用 Kotlin 项目拍摄的照片发送到这个 Python 文件来进行 OCR 操作。我如何连接这两个项目？ C...

python android kotlin image-processing ocr

回答 1 投票 0

在 VSTO Excel Addin 中调用 Azure 文档智能 API

这可能是由于我对 VSTO 插件缺乏了解，但我根本无法从应用程序内调用 Azure 文档智能来工作。我做了一个常规的控制台应用程序，ju...

excel azure vsto ocr excel-addins

回答 1 投票 0

Tesseract 不使用自定义语言.traineddata 文件

我正在尝试向 OCR 教授一种新字体，Beaufort for LOL。为此，我遵循了使用 QT-Box 编辑器的视频中的教程：https://youtu.be/N5Y6gZgvryQ 但完成所有步骤后...

ocr tesseract python-tesseract

回答 1 投票 0

Pytesseract 无法正确识别板

我正在使用 pytesseract 尝试识别车牌，但它没有返回正确的结果。这是我的代码文本 = pytesseract.image_to_string(cropped_License_Plate, lang='eng', config='--psm ...

python ocr python-tesseract

回答 1 投票 0

用于信息提取的 PDF 到 HTML 和 OCR 解决方案

我正在寻找云端或 SDK 格式的 PDF 到 HTML 和 OCR 服务的解决方案。经过搜索，我发现互联网上有很多服务。我尝试了一些...

pdf ocr text-extraction html-content-extraction pdf-to-html

回答 1 投票 0

用于包含数学和表格的 pdf 的最佳 OCR 工具

我开始开发一款专为数学考试量身定制的 examMaker 应用程序，此过程的关键部分涉及将大量数学考试从 PDF 转换为 LaTeX 格式。在尝试了各种...

pdf math latex ocr equation

回答 1 投票 0

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器，它是一个 OCR 代码。我使用以下代码来获取单词：导入超正方体 API =

python image-processing ocr tesseract python-tesseract

回答 9 投票 0

如何从裁剪图像中 OCR 蓝色背景上带有白色字符的文本？

首先，我想使用鼠标事件裁剪图像，然后打印裁剪图像内的文本。我尝试了 OCR 脚本，但所有这些脚本都不适用于下面所附的图像。我认为原因是...

python opencv ocr python-tesseract

回答 2 投票 0

使用 Keras OCR 返回字符串

我正在使用 Keras OCR 的示例来检测图像中的文本。使用官方文档中提供的示例代码，我使用预训练的权重获得了很好的准确性。我打算使用...

python keras ocr

回答 2 投票 0

类型错误：'<' not supported between instances of 'tuple' and 'float'

从PIL导入Image、ImageDraw、ImageFont 图像 = Image.open(img_path).convert('RGB') box = [结果中的行[0]] txts = [结果中的行[1][0]

python machine-learning ocr paddle-paddle paddleocr

回答 1 投票 0

导入错误：无法从“layoutlm

我正在尝试保存 LayoutLM 模型的预测。论文 - https://arxiv.org/abs/1912.13318 笔记本 - https://www.kaggle.com/code/iamarjunchandra/layoutlm-document-sequence-labeling-model/

python machine-learning pdf nlp ocr

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据，但是结果非常糟糕，我想知道是否有办法改进它。这是我的代码：导入io 导入请求 ...

python ocr tesseract python-tesseract image-preprocessing

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值，例如 6、10 等。这是我到目前为止所拥有的：图片=...

python-3.x ocr tesseract python-tesseract text-extraction

回答 1 投票 0

使用 Tesseract 界面进行 OCR

如何在 C# 中使用 Tesseract 的界面 OCR tiff 文件？目前我只知道如何使用可执行文件来做到这一点。