如何最大化ocr的视频准备?

问题描述 投票:0回答:0

我有一个从视频中提取字幕的简单方法,我的意思是,我为此编写了一个脚本。但这种方法的主要问题是为该过程准备视频。我一般做的是:

  1. 我手动选择可用于视频上所有文本的子最小区域。速度还挺快的,就是滑到最后,有代表性的截图就可以加分了
  2. 我可以,非常有帮助的是,调整照片/视频参数。我只使用伽玛和亮度,当然还有将颜色降低到 0。这在某些软件中可以快速完成——视觉上应用“颜色校正”功能。
  3. 运行剩下的程序。

我的问题针对过滤函数这一点。我可以让它变得更好吗?伽马和亮度我想不是我能做的一切。当视频有明亮的背景光时,它通常会与文本混淆,程序会更努力地工作,并且能够返回受到干扰的翻译。我想有一些功能可以让它变得更好。我问的是什么?

我使用了 python:pytesseract、skimage、difflib、deep_translator、speech_recognition 库,我希望其他人有一些可能性,比如我还不知道的一些 sci 工具包或 opencv。

python video ocr python-tesseract image-preprocessing
© www.soinside.com 2019 - 2024. All rights reserved.