我遇到了 pytesseract 的一些奇怪行为

问题描述 投票:0回答:1

我很好奇为什么会发生这种情况。我有两张大小相同、背景颜色几乎相似的图像,但文本不同,pytesseract 无法从一张图像中提取文本,但它与另一张图像完美配合?我缺少什么?

python ocr python-tesseract
1个回答
0
投票

如果我没记错的话,pytesseract 在进行 ocr 之前会进行自己的图像处理。我不确定到底是什么导致了这个问题,但是,无论 pytesseract 正在做什么图像处理都可能是问题的原因。

我会尝试使用 easyocr 和 paddleocr 来比较结果。这两个库期望用户应用图像处理(使用相应的库或由用户自己)。这应该可以让您更好地控制结果。

© www.soinside.com 2019 - 2024. All rights reserved.