假设我想用印地语或任何其他语言进行语音输入 它会给出英文输出(文本)。我该怎么做? 我知道的: 我知道如何将语音转换为文本。
例如。 给出的信息:语言=印地语 输入:kese ho(语音) 输出:你好吗? (以文字形式)
语音转文本使用 ML/AI,因此如果您想自己编码,请查看 PLP 特征、维特比搜索、深度神经网络、判别训练、WFST 框架等算法。如果您只想使用库,我会推荐SpeechRecognition。然后,对于翻译,您需要使用 translate。
说到Python,对于这种多模型类型,Jina似乎值得探索。