语音识别器无法工作:PCM WAV、AIFF/AIFF-C 或 Native FLAC 错误

问题描述 投票:0回答:1

我有以下音频文件

它写着“向下”这个词

我正在尝试将音频转换为文本:

import speech_recognition 

r = sr.Recognizer()
with sr.AudioFile("example.wav") as source:
    audio = r.record(source)
    
    audio_data = r.listen(source)
try:
    s = r.recognize_google(audio)
    print("Text: "+s)
except Exception as e:
    print("Exception: "+str(e))

我收到错误:

ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format

我尝试了所有解决方案这里

我尝试使用

wavio
scipy.io.wavfile

转换音频文件

知道如何解决这个问题吗?

我正在使用speech_recognition 3.9.0和python 3.9

speech-recognition wav speech-to-text
1个回答
0
投票

就我而言,尝试输入音频文件时遇到相同的错误 为了使一切正常工作,请导入声音文件库

import soundfile

接下来,我宣布了带有变量录音的文件的路径,我实际上使用上面的库进行了处理

AudioFile = ('C:\\Users\\user\\PycharmProjects\\project\\audio.wav')
data, samplerate = soundfile.read(AudioFile)
soundfile.write(AudioFile, data, samplerate, subtype='PCM_16')

我在输出时没有收到错误,并且输出是正确的文本

© www.soinside.com 2019 - 2024. All rights reserved.