有没有一种方法可以让我使用 python 中的discord.py 库编程的discord 机器人收听语音通道内所说的内容,然后进行转录。如果可以的话,有哪些方法可以实现呢?
遗憾的是,这仍然是 discord.py 中的一个实验性功能,尚未正确实现:https://github.com/Rapptz/discord.py/issues/1094
您可以查找其他支持语音收听的库,然后检查该语言的语音识别。使用 Google 有很大帮助,例如我发现了这个Discord Speech to Text Bot。
如果他们确实计划添加这样的功能,则需要将音频持续馈送连接到您的机器人,这可能会占用大量存储空间,具体取决于您是监视还是传输此信息。 无论哪种方式,它都类似于 OBS 已经使用 Google 语音识别完成的任务:https://obsproject.com/forum/resources/filled-captioning-via-google-speech-recognition.833/ 。 如果你研究这个软件,你会发现有某种 video.js 插件,它可能对用户开发者免费(但不知道公司的价格。)我希望我能提供有用的帮助,并且您确实找到了某种方式将其集成到您的一个机器人中。
谢谢你。