Speech Studio中拒绝音频数据格式

问题描述 投票:0回答:1

我正在将音频数据的zip文件上传到Speech Studio中的“自定义语音”项目。但是,上传后文件将被拒绝。

我已经尝试过sox和ffmpeg进行文件转换。 sox的输出与doc页面上的要求匹配。我不明白为什么文件被拒绝了。

sox.exe" --i audio1.wav

Input File     : 'audio1.wav'
Channels       : 1
Sample Rate    : 16000
Precision      : 16-bit
Duration       : 00:00:02.27 = 36320 samples ~ 170.25 CDDA sectors
File Size      : 72.7k
Bit Rate       : 256k
Sample Encoding: 16-bit Signed Integer PCM

我将文件压缩并上传。我相信这符合以下要求。

File format RIFF (WAV)
Sample rate 8,000 Hz or 16,000 Hz
Channels    1 (mono)
Maximum length per audio    2 hours
Sample format   PCM, 16-bit
Archive format  .zip
Maximum archive size    2 GB

UI显示“无法上传数据。请检查您的数据格式,然后尝试再次上传。”

我只能相信服务有问题。

speech-to-text microsoft-cognitive
1个回答
0
投票

我对sox经验很少,但是您将ffmpeg用于:ffmpeg.exe -i -ac 1 -ar 16000

您可以在这里找到ffmpeg:https://www.ffmpeg.org/它是免费的。

希望这会有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.