尝试找到一个包来转换来自 Amazon AWS Transcribe 服务的 json 响应,但没有成功。
JSON
的示例。
我不想采取天真的方法,只是将 10 个单词“捆绑”在一起,因为这会以一种奇怪的方式间隔字幕。
我什至接受使用 Google Speech 服务或 Speechmatics 的编程方式。它们都返回一个按单词细分的 json 文件。
以前有人用过吗?
谢谢!
您可能会找到一种方法来做到这一点或创建一个脚本。我还尝试寻找一些现成的解决方案,因此最终编写了一些 JavaScript 代码来从 Amazon Transcribe 的 JSON 输出生成 SRT。
https://www.yash.info/aws-srt-creator.htm
我在句号 (.) 处断句。它是一个独立的 HTML 文件。欢迎根据需要下载并修改。
我使用了 github 上的这个 python 脚本,它非常好地格式化为 docx 格式。输出甚至包括单词置信度的散点图以及更改颜色以降低置信度单词。
https://github.com/kibaffo33/aws_transcribe_to_docx
这对我来说非常有效,但我认为如果你想更改 python 脚本,你可以相当简单地将其转到 html。
受到yash回答的启发,我接受了它并做了一些小改动。放心使用吧。
https://apoorv.blog/aws-transcribe-json-to-srt.html
我个人将这个工具用于我自己的目的,因此希望保持更新。
我遇到了这个答案,并且也通过使用其他一些链接中显示的一些信息来寻找它一段时间 - 接近我可以使用的东西,但没有得到确切的答案,我决定完成解决方案。
第 1 步 - 获取 HTML 模板来处理文本块和演讲者名称,以及按下按钮来处理 javascript 步骤 2 - 将从 Aws 接收到的 json 粘贴到文本块中 第 3 步 - 单击按钮。
Html 页面可以在这里找到:https://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter
我发现有用的一件事是了解翻译的置信度 - 使用它有助于了解翻译中可能存在问题的地方,并且还显示翻译该作品的确切时间,让您可以到达那个地方录音的内容。
好吧,使用它并享受,有一天可能会帮助别人:)
这是一个简单的实用程序脚本,我发现它可以将 Amazon Transcribe .json 转录本转换为更易读的转录本
这里有一个您可能会用到的要点。或者让您了解需要什么。 基本上我最终做了什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae
我最终创建了一个 Bash 脚本来将 AWS Transcribe JSON 文件转换为 SRT。
它使用'jq'来解析JSON文件。
我为此目的构建了一个 Web 应用程序(查看和编辑 aws transcribe JSON 文件):https://scription.app
它将扬声器分开,突出显示低置信度单词并将文本链接到音频播放(如果您加载音频文件)。它仍然是测试版,但希望对看到这篇文章的人有所帮助!