如何阻止 pytesseract 读取文本

问题描述 投票:0回答:1

我想知道一种简单的方法来检查图像是否有Python中的文本。我在here遇到了这个线程,但它完全将图像转换为文本。如果遇到任何文本,有什么办法让它“停止”吗?像这样的东西就太好了

import cv2
import pytesseract
image = cv2.imread('test.jpeg')
try:
    text = pytesseract.image_to_string(image)
except TextEncountered:
    print('Text is found')

python ocr python-tesseract
1个回答
0
投票

一种可能的解决方案是在 pytesseract.image_to_string 函数中使用页面分割模式参数。该参数告诉 pytesseract 如何解释图像的布局。例如,如果您将其设置为 6,它将假定图像包含单个统一的文本块。如果您将其设置为 7,它将假定图像包含单行文本。您可以尝试不同的值,看看哪一个最适合您的图像。

您可以在本文中找到页面分割模式的完整列表

© www.soinside.com 2019 - 2024. All rights reserved.