为什么pytesseract无法识别此简单图像中的数字？

Question

我正在尝试使用pytesseract来识别图像中的两个数字：

我尝试过--psm 6至10
我尝试过-c tessedit_char_whitelist=0123456789'

以上都不返回49编号。我得到的最近的是返回的4，没有9

您有关于如何使tesseract识别它的任何提示吗？

Answer 1

尝试--psm 13 --oem 3（oem = 1或2也应该这样做）

import pytesseract
from PIL import Image
import requests
import io

response = requests.get('https://i.stack.imgur.com/oAAXR.png')
text = pytesseract.image_to_string(Image.open(io.BytesIO(response.content)), lang='eng',
                    config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')

print(text)

您在我的机器上期望的产生49。

我通过本地下载图像并启动获得相同的结果

tesseract oAAXR.png output --oem 3 --psm 13 -l eng

供参考，我的tesseract --version给出tesseract 4.0.0 leptonica-1.77.0 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 2.0.1) : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.1 Found AVX2 Found AVX Found SSE。

Answer 2

您是否尝试过其他--oem？我也将尝试使用高于10的--psm。

Answer 3

对我来说，以下命令仅返回4：

tesseract oAAXR.png out --dpi 300 --psm 11 --oem 1 -c tessedit_char_whitelist=0123456789

使用中：

tesseract 4.1.1-rc2-17-g6343
 leptonica-1.76.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE
 Found libarchive 3.3.3 zlib/1.2.11 liblzma/5.2.4 bz2lib/1.0.6 liblz4/1.8.3 libzstd/1.3.8

为什么pytesseract无法识别此简单图像中的数字？

问题描述投票：1回答：3

3个回答

最新问题

为什么pytesseract无法识别此简单图像中的数字？

问题描述 投票：1回答：3

3个回答

最新问题

问题描述投票：1回答：3