我正计划创建一个可以收听录制的音频文件并可以识别两个或多个人之间的对话的代码。即,有什么方法可以找出特定个人的讲话?
如果我可以通过个人使用音频创建文本抄本,请使用python语音转换为文本。
我不知道从哪里开始。我只是出于我的知识创建此代码。将不胜感激。
有一种方法,请参阅本教程。https://realpython.com/python-speech-recognition/