python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

使用 python 的 PDF 到 DOCX 转换器,它将支持 Bangla 孟加拉语

我正在尝试创建可以从 PDF 文件中准确提取文本、表格和图像的软件。它应该保留原始格式,例如行对齐、制表符,并输出提取的

回答 0 投票 0

pdf 到使用 Tesseract-OCR 的 docx 转换器

我正在尝试开发一个转换器,可以准确地从 PDF 文件中提取文本、表格、对齐方式和制表符格式,包括那些用孟加拉语孟加拉语编写的文件。目前,代码...

回答 0 投票 0

如何处理重叠/套印标签上的 OCR?

我正在使用下面的代码来提取信息 def text_extract(图像): print("text_extract Tessaract OCR ") img_rgb = cv2.cvtColor(图像,cv2.COLOR_BGR2RGB) 打印(pytesser ...

回答 1 投票 0

如何最大化ocr的视频准备?

我有一个从视频中提取字幕的简单方法,我的意思是,我为此编写了一个脚本。但这种方法的主要问题是为该过程准备视频。我在做基因...

回答 0 投票 0

扫描文档的 OCR [关闭]

我从一些带有橡皮图章的扫描文件开始。使用 Open-CV 的一些预处理步骤,橡皮图章被移除,但图像中仍然有一些噪声。在提取 ...

回答 0 投票 0

是否可以将 pytesseract 与 Heroku 一起使用?

我已经阅读了几篇解释如何操作的指南,但它们有点过时并且无法正常工作。我已经尝试配置它几个小时了。有谁知道这是否可能?如果不是那我

回答 1 投票 0

如何在 Ubuntu 上安装 Tesseract-OCR 5.3.1?

我找到了一些用于在 Windows 上安装 Tessetract-OCR 的 .exe 文件,但是当我尝试在 Ubuntu 上安装它时,我得到了 4.0.0。版本而已。我如何安装更多实际版本? 我的 Docker 中需要 Tesseract-OCR

回答 0 投票 0

如何在 vscode 中正确执行 pytesseract?

来自 PIL import Image 导入 pytesseract 打印(pytesseract.image_to_string(Image.open('sample.png'))) 以上是我使用 pytesseract 识别文本的代码 但它显示错误作为附件......

回答 0 投票 0

我想阅读写在图像的一部分中的文字/数字

我有一张股票图表的图像。我已标记入场、SL 和获利水平。这些级别在右侧的彩色框上显示为数字。 我想写一个可以读取那些的代码

回答 0 投票 0

PyMuPdf (fitz) 在 docker 中无法访问

我正在尝试在 docker 文件中完成一些 OCR,因为我无法让它与 Tesseract 一起工作,所以我尝试重构以改用 PyMuPdf。我得到的错误很简单: 文件“/code/table.py&

回答 1 投票 0

如何从具有印地语数据的字符串中提取文本

我正在努力从 pdf 页面中提取印地语文本。我能够得到如下所示的字符串形式的结果:- :2-गंगएवंगगगग

回答 0 投票 0

如何实时捕获游戏分数 - OpenCV 和 Pytesseract

我想实时捕获在 PC 全屏上玩的游戏的分数和计时器,我有下面的工作代码,但是它只会识别分数“0”或计时器“1:13”分开...

回答 1 投票 0

从 PDF 文件中提取印地文文本

我正在执行一项任务,从 pdf 文件中提取一些信息(印地语)并将其转换为数据框。 我尝试了很多东西并关注了很多文章,关于堆栈溢出的答案是......

回答 3 投票 0

Tesseract 无法识别硬币

我遇到了 tesseract 无法破译硬币图像的问题。在线网站已经能够以合理的准确性告诉我代币所说的内容,而我却无法做到

回答 0 投票 0

为什么 pytesseract.image_to_string 不保留字间空格?

使用 Tesseract PS C:\Program Files\Tesseract-OCR> 。 esseract --version tesseract v5.3.0.20221222 leptonica-1.78.0 libgif 5.1.4:libjpeg 8d(libjpeg-turbo 1.5.3):libpng 1.6.34:libtiff 4...

回答 1 投票 0

Tesseract 找不到任何语言

这似乎是一个相当普遍的问题,并且一直在尝试不同的方法来使这个程序工作。我知道有很多与我类似的现有问题,但由于我没有任何方法......

回答 0 投票 0

如何使用 opencv、tesseract 从铁拳 7 中高精度读取计时器倒计时?

THRESH_BINARY 样本 THRESH_BINARY_INV 示例 我正在尝试从铁拳 7 游戏的每一帧中读取数据,我的第一步是使用 tesseract 从计时器中获取数字。在调用 tesseract 之前我...

回答 0 投票 0

Tesseract OCR 在 Cloud Run 实例中给出了一个奇怪的输出,而本地输出是正确的

我们有一个在谷歌云平台上运行的管道: 从文本文档图像中提取作物 处理这些作物以确保它们始终是白色背景上的黑色文本 把庄稼传给

回答 1 投票 0

PyTesseract 不使用数字识别游戏图像

我从游戏中截取了这些屏幕截图,PyTesseract 只识别“==” 图片规格:504x274 PNG 游戏图像 从 pytesseract 导入 pytesseract 从 PIL 导入图像 卡米尼奥 = &quo ...

回答 0 投票 0

如何结合 yolov7 和 ocr

有没有办法将经过训练的 YOLOv7 模型与 OCR 相结合? 我想检测图像中的文字。我制作了一个高精度的 yolov7 算法,它运行良好。现在我想知道如何将 OCR 与

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.