我有兴趣从 Google Meet/Zoom/Microsoft Teams/等通话中捕获音频,并使用浏览器扩展应用程序中的 API 执行实时转录。虽然我知道 WebRTC 作为一个潜在的解决方案,但我仍然不明白如何实现它。有人可以提供有关如何利用 WebRTC 实现此目的或类似目的的指导吗?
请耐心等待并提前致谢!
您可以将系统音频重新映射到输入设备,然后连续调用
webkitSpeechRecognition()
,它将捕获的麦克风发送到远程 Google 服务器并发回转录。
在 Chrome 上,有一种方法可以获取用于将本地麦克风录音发送到的直接 URL(和 Google API 密钥)。