我使用语音转文本 API 使用 python 脚本为音频 ideo(带时间戳的字幕)制作 srt 文件。但它并不是 100% 准确。我有准确的音频文件转录(它有一些不必要的行)。如何根据音频中的时间戳向转录添加时间戳,以便结果将是包含转录中的行和音频中的时间戳的 srt 文件?
我使用api制作srt文件,时间戳的准确性非常好,但文本有时不是。 因此输入是转录本(只是文本),其中包含准确的行和一些不必要的行 输出是 srt 文件,其中转录行根据音频时间戳(api 制作时间戳)。
所以基本上我需要一些 python 代码,将输入记录中的行添加到使用 API 时间戳生成的行。通过比较转录中的行和转录音频中的行,然后如果准确度高则替换它,这可能是可能的。谢谢。