python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

Tesseract.exe 因 Pytesseract 失败

我有一个Python项目,它使用pytesserract将OCR应用于图像并从中获取文本。我已经用 pyinstaller 编译了这个项目,并且该项目在我的本地 Windows 中运行良好

回答 1 投票 0

Pytesseract 无法正确识别数字

我有这个函数可以从数独表中获取数字: def extract_sudoku(image_path): 图像 = cv2.imread(image_path) 灰色 = cv2.cvtColor(图像, cv2.COLOR_BGR2GRAY) 模糊= cv2。

回答 1 投票 0

Python - 解决基本的嘈杂验证码

我正在尝试解决有一点噪音的基本验证码,但事实证明这很困难。 这是其中一个验证码的示例图像: 这是我正在使用的代码: 导入CV2 来自

回答 1 投票 0

使用python从图像中读取阿拉伯语数据[关闭]

我有一个包含阿拉伯语单词和数字的图像,我如何从该图像读取数据并将其写入 Excel 工作表。我尝试使用 pytesseract python 但不起作用。 有人能帮我吗 ? 图像

回答 1 投票 0

我可以采取哪些图像预处理步骤来使该图像OCR可读?

我正在使用 tesseract ocr 从中提取文本。虽然它能够从其他类似图像中提取一些信息,尽管存在轻微的拼写错误,但它无法检测到其中的任何单词......

回答 1 投票 0

Tesseract OCR 无法读取红色背景上的两行文本

我在代码中遇到了 pytesseract 问题。我已尽力使代码尽可能易于阅读,但如果有任何不合理的地方,请告诉我。问题似乎...

回答 1 投票 0

如何对背景为黑色且要提取的文本为红色的图像进行二值化并提取文本(在内存中,而不在磁盘上保存文件)?

我正在尝试使用 cv2 和 pytesseract 从小型桌面的屏幕截图中提取文本,但一切都在内存中。我无法花时间将其保存在磁盘上以进行处理后。 我的问题是当...

回答 1 投票 0

Pytesseract image_to_osd 错误在 0/180 和 90/270 之间没有区别

您好,我的任务是阅读扫描的 pdf,如果有任何 pdf 页面旋转错误,我需要更正它。由于pdf是包含页面的扫描pdf。我通过找到...

回答 0 投票 0

从 Pdf 文件中提取阿拉伯文本(作为图像添加)[已关闭]

我这里有一个pdf文件,我正在尝试从中获取文本,包括英语和阿拉伯语 我尝试过使用超正方体来提取阿拉伯语文本,并设法从主要内容中提取一些内容......

回答 0 投票 0

带有 Tesseract 的空字符串

我正在尝试从一个大文件中读取不同的裁剪图像,并且我设法读取了其中的大部分图像,但是当我尝试使用超正方体读取它们时,其中一些图像会返回空字符串。 该公司...

回答 2 投票 0

使用坐标将文本绘制到可编辑文件中 [win error 5 : access denied]

我正在编写代码,将图像中的字符绘制到与图像相同位置的可编辑文件中。我计划提取文本坐标并将它们绘制在 dxf 文件上。代码是: ...

回答 0 投票 0

从图像中提取表格作为 csvs

我有几个 pdf,其中每个页面都是模糊图像,我想从其页面中提取表格并将每个表格保存为单独的 csv,因此我问了这个问题: 用蓝光从 pdf 中提取表格...

回答 0 投票 0

如何使用python高亮图片中的文字?

我需要完成一项任务,要求我使用机器人框架结合 python 脚本突出显示图像中的文本,但我不知道该怎么做。有人可以帮我弄这个吗?我...

回答 1 投票 0

使用Pytesseract从这张低质量的图片中提取文字

我需要使用 Pytesseract 从这张低质量的图片中提取文本: 我的形象 我的代码: 导入cv2 导入 pytesseract cv2.imwrite('img_crop.png', img_crop) pytesseract.pytesseract.tesseract_cmd ...

回答 0 投票 0

使用 pytesseract OCR 从低质量图像中识别文本

我需要使用 Pytesseract 从这张图片中提取文本: 在此处输入图像描述 我想要以文本形式返回的结果:UJSQHTK

回答 0 投票 0

Tesseract 不输出此图像的 025575 中的第一个零。如何让它打印其中的第一个零?

Tesseract 不输出此图像的 025575 中的第一个零。它只输出 25575。 这是我尝试过的: 这是 sn_img: 这是我的代码: 导入cv2 导入 pytesseract 将 numpy 导入为 np

回答 0 投票 0

Pytesseract 不在 MacOS 上保留临时文件

跑步时 导入cv2 将 numpy 导入为 np 导入 pytesseract pytesseract.pytesseract.tesseract_cmd = '/usr/local/bin/tesseract' img = cv2.imread('some.png') h, w, c = img.形状 盒子 = pytesseract.

回答 1 投票 0

为什么 numpy 数组看起来没有形状?

我了解以下内容: 将 numpy 导入为 np arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8]]) 打印(arr.shape) 输出: (2, 4) 所以我想知道为什么我得到以下信息: 导入 numpy 进口

回答 2 投票 0

使用 Python 中的 OCR、pytesseract 和 opencv 翻译图像内的文本并将翻译后的文本写回 img(相同位置)时出现问题

我正在做一个关于 python 中的 OCR 翻译的项目。我正在尝试编写一个脚本,该脚本获取一个充满图像的网页,其中包含一些文本。通过 OCR 它将检测将被转录的文本...

回答 1 投票 0

Pytesseract 和 OpenCV 尝试检测文本中的倾斜

我有一些图片,比如一个包。这个包,上面有一个标题,是文字。我一直在尝试找到一种方法来检测文本偏离的角度(例如 4 度、-4 度等......

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.