如何创建音频缓冲区以在几秒钟前访问麦克风输入

问题描述投票：0回答：1

我正在尝试创建一种语音识别功能，该功能可以通过热键激活。我找到了这个snowboy程序包，可以创建一个热词侦听器，该侦听器可以全时侦听并在激活时运行特定任务。

我的问题是，在检测到热门单词后，我需要运行语音身份验证功能。假设我的口号是“你好”，而我的语音身份验证的输入需求是“你好，请开门”。但是，如果在检测到热门单词后开始录制，我需要重复打个招呼。我如何获得完整的“你好，请开门”录音而不重复。

有没有办法让snowboy可以输出它用来激活的短音频文件“ hello”，如果是的话，我可以将它们组合起来。

如果现在我可以创建一个音频缓冲区，该缓冲区将始终保留麦克风数据的最后10秒钟，而不会大大降低cpu的影响。同时，这也需要与雪人共享麦克风。

这是我的主意，但我不知道如何实现。请告诉我我该怎么做或其他我可以得到完整的录音。

随意编辑问题是不清楚的地方。

谢谢！

python

audio

recording

snowboy

hotword

1个回答

0
投票

是。检测到后，Snowboy默认情况下会播放在资源文件夹中找到的“叮”波形文件。您可以编辑snowboydecoder.HotwordDetector函数来播放另一个声音文件，而不是ding（您可能需要大致了解其编译语言）。您可以下载自定义wave文件在此处播放，也可以使用Internet上各种免费的TTS API列表生成“机器人声音”自定义消息，并将其保存到计算机中。如果需要，我将提供详细解释

如何创建音频缓冲区以在几秒钟前访问麦克风输入

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1