我将编写一个从图像中获取文本的代码,并为此使用了 Pytesseract,但它没有给出正确的结果。我又用了几个来源,但结果还是一样。
import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r"C:\tesseract\Tesseract-OCR\tesseract.exe"
def ocr_core(img):
return pytesseract.image_to_string(img)
def get_grayscale(img):
return cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
def remove_noise(img):
return cv2.medianBlur(img,5)
def threshold(img):
return cv2.threshold(img,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
img = cv2.imread(r"/path/to/filename.jpg")
img = get_grayscale(img)
img = threshold(img)
img = remove_noise(img)
print(ocr_core(img))
如何解决这个问题? 提前谢谢你
pytesseract 从图像中获取文本并进行图像处理