扬声器识别API识别配置文件-创建注册:如何从网页以指定格式录制音频?

问题描述 投票:1回答:1

音频文件格式必须满足以下要求。

  • 容器WAV
  • 编码PCM
  • Rate 16K
  • 样本格式16位
  • Channels Mono。

如何从网页上实现?找不到任何资源:(

javascript azure wav azure-cognitive-services recorder.js
1个回答
0
投票

使用ffmpeg(请参见FFmpeg wiki,或带有man ffmpeg的手册页]

此命令会将任何音频或视频更改为

  • PCM 16位(-acodec pcm_s16le
  • 16K(-ar 16000
  • 单声道(-ac 1

ffmpeg -i input.any -acodec pcm_s16le -ac 1 -ar 16000 output.wav

对于网络,这里有多个选项是2

  1. github.com/muaz-khan/RecordRTC
  2. https://github.com/rposbo/speaker-recognition-api/blob/master/recorder.js
© www.soinside.com 2019 - 2024. All rights reserved.