如何根据音频文件添加时间戳到转录文件中? (结果是srt文件)

问题描述 投票:0回答:1

我使用语音转文本 API 使用 python 脚本为音频 ideo(带时间戳的字幕)制作 srt 文件。但它并不是 100% 准确。我有准确的音频文件转录(它有一些不必要的行)。如何根据音频中的时间戳向转录添加时间戳,以便结果将是包含转录中的行和音频中的时间戳的 srt 文件?

我使用api制作srt文件,时间戳的准确性非常好,但文本有时不是。 因此输入是转录本(只是文本),其中包含准确的行和一些不必要的行 输出是 srt 文件,其中转录行根据音频时间戳(api 制作时间戳)。

所以基本上我需要一些 python 代码,将输入记录中的行添加到使用 API 时间戳生成的行。通过比较转录中的行和转录音频中的行,然后如果准确度高则替换它,这可能是可能的。谢谢。

python artificial-intelligence speech-recognition speech-to-text video-subtitles
1个回答
0
投票

您要在此处执行的具体任务称为“强制对齐”。此链接是一个很好的工具集合,您可以探索以进行强制对齐。它包括一些Python工具:

https://github.com/pettarin/forced-alignment-tools

© www.soinside.com 2019 - 2024. All rights reserved.