如何从图像中预测字符？

问题描述投票：0回答：1

要求：从图像中读取或预测字符。

Preq：我在Python中使用pytesseract和opencv从imagesv读取文本，但我看到了一个问题，如下所述。

问题：

很少有图像的文本被水平切片（如附件所示）。
当我运行 python 函数从附加图像中读取文本时，它会读取不正确的文字。从图像中读取文本的示例代码片段如下。

实际输出：对于附加图像而不是UnAuthorizedInteger，它读作InAutharizedintanear

    def extract_text_from_image(image_path):
       image = Image.open(image_path)
       text = pytesseract.image_to_string(image)
       return text

那么，当图像如上面所附的那样进行切片时，我们可以使用任何深度学习模型来预测图像中的文本吗？如果是，请告诉我要应用的策略。

python machine-learning deep-learning nlp neural-network

1个回答

0
投票

是的，即使图像被切片，您也可以使用深度学习模型来预测图像中的文本。这涉及计算机视觉和自然语言处理技术的结合。

图像预处理：由于图像被切片，第一步是确保它们采用适合模型处理的格式。
图像重新组装：如果切片图像是被切割的较大图像的一部分，您可能需要将它们重新组装成原始图像。
文本检测：您可以使用文本检测算法来识别文本在图像中的位置。
文本识别：您需要应用 OCR 来检测和识别图像中的文本。有几种针对 OCR 任务设计的深度学习模型，例如 Tesseract、CRNN、Paddle OCR、Simply OCR 等。或者，如果您有足够的数据集，您可以训练您的 OCR 深度学习模型。
后处理：提取文本后，您可能需要对其进行清理。这可以包括纠正拼写错误、删除非文本元素、应用 NLP 技术来确保文本在上下文中有意义。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.