我想从附件图像(png文件)中读取一列数字。
“>
我的代码是
import cv2 import pytesseract import os img = cv2.imread(os.path.join(image_path, image_name), 0) config= "-c tessedit_char_whitelist=01234567890.:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" pytesseract.image_to_string(img, config=config)
此代码为我提供了输出字符串:'n113 \ nun \ n1.08'。如我们所见,存在两个问题:
如何解决这些问题?
最佳
我想从附件图像(png文件)中读取一列数字。我的代码是import cv2 import pytesseract import os img = cv2.imread(os.path.join(image_path,image_name),0)config =“ -c ...
您需要预处理图像。一种简单的方法是使用Otsu的阈值调整图像大小,转换为灰度并获得二进制图像。在这里,我们可以应用轻微的高斯模糊,然后反转图像,以便提取的所需文本为白色,背景为黑色。这是准备用于OCR的已处理图像