用于直播音频的AWS Transcribe>流转录功能和Kinesis视频流(用于音频输入)之间有什么区别

问题描述 投票:0回答:1

嗨,我的要求是我有现场音频流作为输入,比如2个人之间的通话,现在将该音频转换为现场文本,并从提取的文本中选择某些关键字并插入数据库。

根据https://github.com/aws-samples/amazon-connect-realtime-transcription中的体系结构,AWS Kinesis Video Streams服务和AWS Transcribe都用于实时流式传输,但根据链接:https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS Transcribe支持实时转录,那么为什么Kinesis使用该体系结构?

如果有人知道,请帮助我理解,希望亚马逊连接可以将实时音频摄取到AWS Transcribe进行实时转录。

amazon-web-services amazon-kinesis aws-transcribe amazon-kinesis-agent
1个回答
2
投票

Amazon Kinesis Video Streams是一项支持Amazon Connect流式传输语音数据的服务。 Amazon Transcribe可以从任何来源获取实时转录流,但从Amazon Connect获取实时数据的唯一方法是通过Kinesis。 launch announcement for real-time streams可能有助于使这更清楚:

通过客户语音流功能,您的客户音频将自动发送到Amazon Kinesis Video Streams,您可以通过所允许的集成访问它。例如,您可以将客户语音流与实时文本转录和情绪分析集成,以立即反馈通话质量,或者将此功能与第三方语音生物识别产品一起使用,以自动验证呼叫者,而无需输入密码或确认个人信息。

© www.soinside.com 2019 - 2024. All rights reserved.