我需要什么:将实时音频从浏览器以WAV格式流式传输到node.js服务器。
听起来很简单-问题:使用getUserMedia可获得audio/webm
格式的音频流BUT。 node.js服务器连接到语音到文本引擎(deepspeech),该引擎只能处理WAV格式的流。
已起作用:我已经可以录制固定长度的WAV音频Blob(通过RecorderJs),并将完成的录音发送到node.js服务器,并从readFileSync
服务器端获取其流。储存库here(仅主服务器工作)。但是我已经没有固定的录音了,我想连续不断地直播音频。
到目前为止,我不确定这是否在node.js或任何现有库的范围内。我研究了ffmpeg,但没有找到一种方法来更改流的编码。我只能使用ffmpeg更改固定文件/ blob的编码。
如果有人可以带领我朝正确的方向前进,以便我知道从哪里开始,我将不胜感激。
FFmpeg是要走的路。
我研究了ffmpeg,但没有找到一种方法来更改流的编码。
将-
用于输入文件,并将-
用于输出文件。然后在您的Node.js子进程上使用STDIN / STDOUT流。