我有一个从视频中提取字幕的简单方法,我的意思是,我为此编写了一个脚本。但这种方法的主要问题是为该过程准备视频。我一般做的是:
我的问题针对过滤函数这一点。我可以让它变得更好吗?伽马和亮度我想不是我能做的一切。当视频有明亮的背景光时,它通常会与文本混淆,程序会更努力地工作,并且能够返回受到干扰的翻译。我想有一些功能可以让它变得更好。我问的是什么?
我使用了 python:pytesseract、skimage、difflib、deep_translator、speech_recognition 库,我希望其他人有一些可能性,比如我还不知道的一些 sci 工具包或 opencv。