我有以下音频文件
它写着“向下”这个词
我正在尝试将音频转换为文本:
import speech_recognition
r = sr.Recognizer()
with sr.AudioFile("example.wav") as source:
audio = r.record(source)
audio_data = r.listen(source)
try:
s = r.recognize_google(audio)
print("Text: "+s)
except Exception as e:
print("Exception: "+str(e))
我收到错误:
ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format
我尝试了所有解决方案这里
我尝试使用
wavio
和 scipy.io.wavfile
转换音频文件
知道如何解决这个问题吗?
我正在使用speech_recognition 3.9.0和python 3.9
就我而言,尝试输入音频文件时遇到相同的错误 为了使一切正常工作,请导入声音文件库
import soundfile
接下来,我宣布了带有变量录音的文件的路径,我实际上使用上面的库进行了处理
AudioFile = ('C:\\Users\\user\\PycharmProjects\\project\\audio.wav')
data, samplerate = soundfile.read(AudioFile)
soundfile.write(AudioFile, data, samplerate, subtype='PCM_16')
我在输出时没有收到错误,并且输出是正确的文本