ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

使用 Python OpenCV 进行文本检测和分割

我正在使用下面的算法将句子分割成单词,将单词分割成字符。 正如您在下面的输出中看到的,“STAND”一词中的字母“S”和“T”被绑定在一起,我可以...

回答 1 投票 0

如何从 AWS Textract 分析的文档中按阅读顺序打印表格和行

我正在使用 AWS Textract 从 pdf 文档中提取文本和表格。 我需要可以解析提取的文本、提取的表格并按顺序打印一个字符串中的所有内容的代码...

回答 1 投票 0

如何获得身份证件识别SDK终身授权

我正在尝试运行 KBY-AI 公司的以下存储库。 但是当我运行 docker 容器时,它返回 -1 作为激活值。 它似乎在内部被停用,我找不到有效的许可证...

回答 1 投票 0

如何使用python从图像中读取文本

我有这张图片:在此处输入图片描述 我需要读取该图像中的数字。 我尝试过 easyocr 库,但它不能读取所有数字。我还使用了 pytesseract 库,b...

回答 1 投票 0

改善存在覆盖线的文本识别

这是一个简单的Python 3光学字符识别(OCR)程序来获取字符串,我已经在这里上传了目标gif文件,请下载并保存为/tmp/target.gif。 尝试: 来自 PIL

回答 2 投票 0

使用Python突出显示图像中的特定文本

我想在网站截图中突出显示特定的单词/句子。 截取屏幕截图后,我使用 pytesseract 和 cv2 提取文本。这很有效,我可以获取有关...的文本和数据

回答 2 投票 0

easyocr 警告 CUDA 不可用 - 默认为 CPU。注意:使用 GPU 时该模块速度更快

我参考这篇文章来检查我的cuda驱动程序。就满足要求了。但torch仍然无法使用GPU。 操作系统信息: Windows 10 包及环境信息: (.env) PS E:\TMP> nvidia-smi 星期二...

回答 2 投票 0

如何使用Python读取图像中的七段显示和标志?

我有一堆能量计的照片。在每张照片中,仪表上都写有信息,还有一个七段显示屏,读数以千瓦时为单位。另外,还有仪表制造商的标志。我...

回答 1 投票 0

将图像上的标题(文本)裁剪到特定边框(按颜色)

如何沿着下部红色背景的边框从图像中剪切标题(示例如下)?我正在计划一个批处理过程,即使用数百张具有不同标题的图像(都带有

回答 1 投票 0

确定的 OCR 质量

我有一个低质量的英文PDF文件,没有图像,没有表格,单列,完全黑白 - 甚至没有灰色。我使用了 ABBYY FineReader,它检测到的文本很好,我可以海...

回答 1 投票 0

如何提高PaddleOCR性能,有时无法检测单词之间的空格

我正在使用 paddleOCR 从日常使用的项目中提取数据,它在大多数情况下工作正常,但有时它会将两个或多个单词混合为一个单词,它不会占用空间......

回答 2 投票 0

获取 UnboundLocalError:在将 craft-text- detector 应用于 python 中的图像时,在赋值之前引用局部变量“img”

我正在尝试使用Python中的craft-text- detector获取图像作物。 使用 craft-text- detector==0.4.3 torch==1.11.0 torchvision==0.12.0 numpy==1.23.0 代码: # 导入工艺函数 来自 craft_text_de...

回答 1 投票 0

Python 的 Tesseract - 奇怪的 OCR 结果 - 转换数字行但无法转换每个单独的数字

在 python 中使用 Tesseract 并得到不一致的 OCR 结果 - 它可以正确转换数字行,但无法转换每个单独的数字。 例如,对于此图像 1 Tesseract 给出了正确的 r...

回答 1 投票 0

如何链接 Kotlin 和 Python 项目?

我有一个带有 OCR、图像处理步骤的 python 项目。我想通过将我用 Kotlin 项目拍摄的照片发送到这个 Python 文件来进行 OCR 操作。我如何连接这两个项目? C...

回答 1 投票 0

在 VSTO Excel Addin 中调用 Azure 文档智能 API

这可能是由于我对 VSTO 插件缺乏了解,但我根本无法从应用程序内调用 Azure 文档智能来工作。我做了一个常规的控制台应用程序,ju...

回答 1 投票 0

Tesseract 不使用自定义语言.traineddata 文件

我正在尝试向 OCR 教授一种新字体,Beaufort for LOL。 为此,我遵循了使用 QT-Box 编辑器的视频中的教程:https://youtu.be/N5Y6gZgvryQ 但完成所有步骤后...

回答 1 投票 0

Pytesseract 无法正确识别板

我正在使用 pytesseract 尝试识别车牌,但它没有返回正确的结果。 这是我的代码 文本 = pytesseract.image_to_string(cropped_License_Plate, lang='eng', config='--psm ...

回答 1 投票 0

用于信息提取的 PDF 到 HTML 和 OCR 解决方案

我正在寻找云端或 SDK 格式的 PDF 到 HTML 和 OCR 服务的解决方案。经过搜索,我发现互联网上有很多服务。我尝试了一些...

回答 1 投票 0

用于包含数学和表格的 pdf 的最佳 OCR 工具

我开始开发一款专为数学考试量身定制的 examMaker 应用程序,此过程的关键部分涉及将大量数学考试从 PDF 转换为 LaTeX 格式。在尝试了各种...

回答 1 投票 0

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器,它是一个 OCR 代码。 我使用以下代码来获取单词: 导入超正方体 API =

回答 9 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.