如何将 Amazon Transcribe json 响应转换为字幕格式(srt、webvvt 等)?

问题描述 投票:0回答:10

尝试找到一个包来转换来自 Amazon AWS Transcribe 服务的 json 响应,但没有成功。

您可以在 Fiddle 的 JavaScript 部分看到

JSON
的示例

我不想采取天真的方法,只是将 10 个单词“捆绑”在一起,因为这会以一种奇怪的方式间隔字幕。

我什至接受使用 Google Speech 服务或 Speechmatics 的编程方式。它们都返回一个按单词细分的 json 文件。

以前有人用过吗?

谢谢!

json amazon-web-services speech-to-text webvtt
10个回答
8
投票

您可能会找到一种方法来做到这一点或创建一个脚本。我还尝试寻找一些现成的解决方案,因此最终编写了一些 JavaScript 代码来从 Amazon Transcribe 的 JSON 输出生成 SRT。

https://www.yash.info/aws-srt-creator.htm

我在句号 (.) 处断句。它是一个独立的 HTML 文件。欢迎根据需要下载并修改。


3
投票

我使用了 github 上的这个 python 脚本,它非常好地格式化为 docx 格式。输出甚至包括单词置信度的散点图以及更改颜色以降低置信度单词。

https://github.com/kibaffo33/aws_transcribe_to_docx

这对我来说非常有效,但我认为如果你想更改 python 脚本,你可以相当简单地将其转到 html。


1
投票

受到yash回答的启发,我接受了它并做了一些小改动。放心使用吧。

https://apoorv.blog/aws-transcribe-json-to-srt.html

我个人将这个工具用于我自己的目的,因此希望保持更新。


0
投票

这里有一些东西(

aws-transcribe-to-vtt
)但我还没来得及测试...


0
投票

我遇到了这个答案,并且也通过使用其他一些链接中显示的一些信息来寻找它一段时间 - 接近我可以使用的东西,但没有得到确切的答案,我决定完成解决方案。

第 1 步 - 获取 HTML 模板来处理文本块和演讲者名称,以及按下按钮来处理 javascript 步骤 2 - 将从 Aws 接收到的 json 粘贴到文本块中 第 3 步 - 单击按钮。

Html 页面可以在这里找到:https://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter

我发现有用的一件事是了解翻译的置信度 - 使用它有助于了解翻译中可能存在问题的地方,并且还显示翻译该作品的确切时间,让您可以到达那个地方录音的内容。

好吧,使用它并享受,有一天可能会帮助别人:)


0
投票

这是一个简单的实用程序脚本,我发现它可以将 Amazon Transcribe .json 转录本转换为更易读的转录本

https://github.com/purdy/aws-transcribe-transcript


0
投票

这里有一个您可能会用到的要点。或者让您了解需要什么。 基本上我最终做了什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae


0
投票

我最终创建了一个 Bash 脚本来将 AWS Transcribe JSON 文件转换为 SRT。

它使用'jq'来解析JSON文件。

https://github.com/nicolasps/aws-transcribe-to-srt


0
投票

我为此目的构建了一个 Web 应用程序(查看和编辑 aws transcribe JSON 文件):https://scription.app

它将扬声器分开,突出显示低置信度单词并将文本链接到音频播放(如果您加载音频文件)。它仍然是测试版,但希望对看到这篇文章的人有所帮助!


0
投票

这是一个老问题,5 年前这些答案是必要的。偶然发现这个问题,发现2022年他们直接在服务中把srt和vtt做成了输出选项。 服务文档在这里

© www.soinside.com 2019 - 2024. All rights reserved.