无法使Google API处理WAV音频

问题描述 投票:-1回答:1

我想从电话中抄录简单的音频。

我目前正在使用语音API

const speech = require('@google-cloud/speech').v1p1beta1;

关于我要转录的音频的信息:

  • 编解码器:PCM MU-LAW(法律)
  • 频道:立体声
  • 采样率:8000
  • 每个样本的位数:16
  • 持续时间:35秒

我正在使用此配置的API:

const requestGoogle = {
      audio: {
        uri: [ my audio location ]
      },
      config: {
        audioChannelCount: 2,
        enableSeparateRecognitionPerChannel: true,
        enableAutomaticPunctuation: true,
        languageCode,
        model: 'default',
        useEnhanced: true,
        interactionType: 'PHONE_CALL',
        encoding: 'MULAW',
        microphoneDistance: 'NEARFIELD',
        recordingDeviceType: 'PHONE_LINE',
      }
    };

向API请求时,我收到400错误的状态,并显示错误消息:

{

“错误”:“ 3 INVALID_ARGUMENT:无效的识别'config':错误的通道数。”

}

如果有人可以帮助我,那就太好了,谢谢!

google-api speech-recognition text-to-speech wav google-cloud-speech
1个回答
0
投票

[使用G711解码器将编解码器数据-从编解码器:PCM MU-LAW(mlaw)转换为-编解码器:PCM-]

使用频道:单声道。

© www.soinside.com 2019 - 2024. All rights reserved.