如何将实时音频从麦克风转换为文本?

问题描述 投票:1回答:1

我需要使用python和Google语音到文本API构建语音到文本转换器。我想像本例link那样实时进行到目前为止,我已经尝试了以下代码:

import speech_recognition as sr
import pyaudio


r= sr.Recognizer()
print("Running")

p = pyaudio.PyAudio()
for i in range(p.get_device_count()):
    print(p.get_device_info_by_index(i))

with sr.Microphone(1) as source:
    r.adjust_for_ambient_noise(source, 1)  # Adjust for ambient
    print("Say something!")
    audio=r.listen(source)
print("Runnnnnn")
try:
    print("Analyzing voice data  "+r.recognize_google(audio, language='hi-IN'))
except Exception:
    print("Something went wrong")

此代码首先通过麦克风侦听,然后转换为文本格式。我想在这里实现的是边听边应该开始实时转换为文本,而不是等待完成。

python speech-recognition speech-to-text google-speech-api
1个回答
0
投票

[链接到文档link to python SDK Houndify Python SDK允许您从Python项目向Houndify API进行流语音和文本查询。您可以使用SDK提供的StreamingHoundClient类进行语音查询,并在Houndify平台上启用适当的域以获取即时答案。尽管该平台可以将语音直接转换为含义,但是如果您仍想获取录制的音频的转录本,则可以使用“语音转换为文本”域。

这里是有关如何设置它的文档的链接,这里是Python SDK的链接。您必须登录才能访问文档并下载适用于Python 2.7或Python 3.0的SDK。

这应该使您可以查询并立即获得答案。

© www.soinside.com 2019 - 2024. All rights reserved.