我正在将音频数据的zip文件上传到Speech Studio中的“自定义语音”项目。但是,上传后文件将被拒绝。
我已经尝试过sox和ffmpeg进行文件转换。 sox的输出与doc页面上的要求匹配。我不明白为什么文件被拒绝了。
sox.exe" --i audio1.wav
Input File : 'audio1.wav'
Channels : 1
Sample Rate : 16000
Precision : 16-bit
Duration : 00:00:02.27 = 36320 samples ~ 170.25 CDDA sectors
File Size : 72.7k
Bit Rate : 256k
Sample Encoding: 16-bit Signed Integer PCM
我将文件压缩并上传。我相信这符合以下要求。
File format RIFF (WAV)
Sample rate 8,000 Hz or 16,000 Hz
Channels 1 (mono)
Maximum length per audio 2 hours
Sample format PCM, 16-bit
Archive format .zip
Maximum archive size 2 GB
UI显示“无法上传数据。请检查您的数据格式,然后尝试再次上传。”
我只能相信服务有问题。
我对sox经验很少,但是您将ffmpeg用于:ffmpeg.exe -i -ac 1 -ar 16000
您可以在这里找到ffmpeg:https://www.ffmpeg.org/它是免费的。
希望这会有所帮助。