PyTesseract 给出不好的结果

问题描述 投票:0回答:1

我将编写一个从图像中获取文本的代码,并为此使用了 Pytesseract,但它没有给出正确的结果。我又用了几个来源,但结果还是一样。

import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r"C:\tesseract\Tesseract-OCR\tesseract.exe"

def ocr_core(img):
    return pytesseract.image_to_string(img)

def get_grayscale(img):
    return cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)


def remove_noise(img):
    return cv2.medianBlur(img,5)

def threshold(img):
    return cv2.threshold(img,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

img = cv2.imread(r"/path/to/filename.jpg")
img = get_grayscale(img)
img = threshold(img)
img = remove_noise(img)

print(ocr_core(img))

如何解决这个问题? 提前谢谢你

pytesseract 从图像中获取文本并进行图像处理

python ocr
1个回答
0
投票

input_picture

上面给出了代码输入的图像。 但它给出这样的输出;

output_Picture

我问如何才能获得更一致的输出。

© www.soinside.com 2019 - 2024. All rights reserved.