如何从图像中预测字符?

问题描述 投票:0回答:1

要求:从图像中读取或预测字符。

Preq:我在Python中使用pytesseract和opencv从imagesv读取文本,但我看到了一个问题,如下所述。

问题:

  1. 很少有图像的文本被水平切片(如附件所示)。

  2. 当我运行 python 函数从附加图像中读取文本时,它会读取 不正确的文字。从图像中读取文本的示例代码片段如下。

实际输出:对于附加图像而不是UnAuthorizedInteger,它读作InAutharizedintanear

    def extract_text_from_image(image_path):
       image = Image.open(image_path)
       text = pytesseract.image_to_string(image)
       return text  

那么,当图像如上面所附的那样进行切片时,我们可以使用任何深度学习模型来预测图像中的文本吗?如果是,请告诉我要应用的策略。

python machine-learning deep-learning nlp neural-network
1个回答
0
投票

是的,即使图像被切片,您也可以使用深度学习模型来预测图像中的文本。这涉及计算机视觉和自然语言处理技术的结合。

  1. 图像预处理:由于图像被切片,第一步是确保它们采用适合模型处理的格式。
  2. 图像重新组装:如果切片图像是被切割的较大图像的一部分,您可能需要将它们重新组装成原始图像。
  3. 文本检测:您可以使用文本检测算法来识别文本在图像中的位置。
  4. 文本识别:您需要应用 OCR 来检测和识别图像中的文本。有几种针对 OCR 任务设计的深度学习模型,例如 Tesseract、CRNN、Paddle OCR、Simply OCR 等。或者,如果您有足够的数据集,您可以训练您的 OCR 深度学习模型。
  5. 后处理:提取文本后,您可能需要对其进行清理。这可以包括纠正拼写错误、删除非文本元素、应用 NLP 技术来确保文本在上下文中有意义。
© www.soinside.com 2019 - 2024. All rights reserved.