如何将 Amazon Transcribe json 响应转换为字幕格式（srt、webvvt 等）？

Question

尝试找到一个包来转换来自 Amazon AWS Transcribe 服务的 json 响应，但没有成功。

您可以在 Fiddle 的 JavaScript 部分看到

JSON

我不想采取天真的方法，只是将 10 个单词“捆绑”在一起，因为这会以一种奇怪的方式间隔字幕。

我什至接受使用 Google Speech 服务或 Speechmatics 的编程方式。它们都返回一个按单词细分的 json 文件。

以前有人用过吗？

谢谢！

Answer 1

您可能会找到一种方法来做到这一点或创建一个脚本。我还尝试寻找一些现成的解决方案，因此最终编写了一些 JavaScript 代码来从 Amazon Transcribe 的 JSON 输出生成 SRT。

我在句号 (.) 处断句。它是一个独立的 HTML 文件。欢迎根据需要下载并修改。

Answer 2

我使用了 github 上的这个 python 脚本，它非常好地格式化为 docx 格式。输出甚至包括单词置信度的散点图以及更改颜色以降低置信度单词。

这对我来说非常有效，但我认为如果你想更改 python 脚本，你可以相当简单地将其转到 html。

Answer 3

受到yash回答的启发，我接受了它并做了一些小改动。放心使用吧。

我个人将这个工具用于我自己的目的，因此希望保持更新。

Answer 4

aws-transcribe-to-vtt

)但我还没来得及测试...

Answer 5

我遇到了这个答案，并且也通过使用其他一些链接中显示的一些信息来寻找它一段时间 - 接近我可以使用的东西，但没有得到确切的答案，我决定完成解决方案。

第 1 步 - 获取 HTML 模板来处理文本块和演讲者名称，以及按下按钮来处理 javascript 步骤 2 - 将从 Aws 接收到的 json 粘贴到文本块中第 3 步 - 单击按钮。

我发现有用的一件事是了解翻译的置信度 - 使用它有助于了解翻译中可能存在问题的地方，并且还显示翻译该作品的确切时间，让您可以到达那个地方录音的内容。

好吧，使用它并享受，有一天可能会帮助别人:)

Answer 6

这是一个简单的实用程序脚本，我发现它可以将 Amazon Transcribe .json 转录本转换为更易读的转录本

Answer 7

这里有一个您可能会用到的要点。或者让您了解需要什么。基本上我最终做了什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae

Answer 8

我最终创建了一个 Bash 脚本来将 AWS Transcribe JSON 文件转换为 SRT。

它使用'jq'来解析JSON文件。

Answer 9

我为此目的构建了一个 Web 应用程序（查看和编辑 aws transcribe JSON 文件）：https://scription.app

它将扬声器分开，突出显示低置信度单词并将文本链接到音频播放（如果您加载音频文件）。它仍然是测试版，但希望对看到这篇文章的人有所帮助！

Answer 10

这是一个老问题，5 年前这些答案是必要的。偶然发现这个问题，发现2022年他们直接在服务中把srt和vtt做成了输出选项。服务文档在这里。