有谁知道 Twilio 是否可以在通话期间基于一种音频标志或模式(例如静音)创建多个音频记录。这样您就可以在每个语音部分结束时触发回调,以在通话期间生成文本。
谢谢...
这里是 Twilio 布道者。
因此,您可以使用
timeout
动词上的
<Record>
属性来获得简短的“突发”语音文本,但这可能意味着您在呼叫者说出单词时超时。所以你只能得到一半!这可能会导致很难理解所说的内容,我个人不会使用这种方法。
您可以使用
finishOnKey
属性通过按键(DTMF 音)结束录音,这可能会满足您的需求。
您目前无法获得实时或近乎实时的转录。您将很快收到转录,但我们仅支持超时和按键来结束录音并开始转录。
希望这有帮助!
要使用 Twilio 进行实时转录,您需要使用带有 Twilio Media Streams 的第三方语音转文本,它还支持流式/无限语音到文本识别,例如 Google Cloud Speech To Text。不幸的是,我认为没有本地 Twilio 动词或动作可以进行实时语音到文本/实时转录。也许你可以在 iOS 上运行一些东西,但我认为让后端服务器处理这可能会更好,并且将来更具可扩展性。
在较高层面上,您需要执行以下操作:
有几个在线指南介绍如何针对不同语言准确执行此操作: