如何将实时音频从麦克风转换为文本？

Question

我需要使用python和Google语音到文本API构建语音到文本转换器。我想像本例link那样实时进行到目前为止，我已经尝试了以下代码：

import speech_recognition as sr
import pyaudio


r= sr.Recognizer()
print("Running")

p = pyaudio.PyAudio()
for i in range(p.get_device_count()):
    print(p.get_device_info_by_index(i))

with sr.Microphone(1) as source:
    r.adjust_for_ambient_noise(source, 1)  # Adjust for ambient
    print("Say something!")
    audio=r.listen(source)
print("Runnnnnn")
try:
    print("Analyzing voice data  "+r.recognize_google(audio, language='hi-IN'))
except Exception:
    print("Something went wrong")

此代码首先通过麦克风侦听，然后转换为文本格式。我想在这里实现的是边听边应该开始实时转换为文本，而不是等待完成。

Answer 1

[链接到文档link to python SDK Houndify Python SDK允许您从Python项目向Houndify API进行流语音和文本查询。您可以使用SDK提供的StreamingHoundClient类进行语音查询，并在Houndify平台上启用适当的域以获取即时答案。尽管该平台可以将语音直接转换为含义，但是如果您仍想获取录制的音频的转录本，则可以使用“语音转换为文本”域。

这里是有关如何设置它的文档的链接，这里是Python SDK的链接。您必须登录才能访问文档并下载适用于Python 2.7或Python 3.0的SDK。

这应该使您可以查询并立即获得答案。

如何将实时音频从麦克风转换为文本？

问题描述投票：1回答：1

1个回答

最新问题

如何将实时音频从麦克风转换为文本？

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1