speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。

识别使用Java的人说的字母

我需要识别用户在设备的麦克风中说出的字母。该设备可以是Android驱动的手机。例如,当用户说“ R”时,应该给我“ R”而不是“ Are”。...

回答 6 投票 11

将离线语音颤动以识别文本

我正在开发使用Flutter构建的新应用,我需要添加语音识别(离线模式)。我实际上已经从Google测试了一个:https://pub.dev/packages/speech_recognition,...

回答 1 投票 1

从Java代码到带有烧瓶API的字节或流的块

我正在使用getUsermedia将来自JavaScript浏览器的音频数据块发送到flask python api,以语音转换为文本。最初,我曾经将音频块转换为Blob,然后将文件方法用于...

回答 1 投票 1

如何在Java中获得语料库?

我想获取语料库列表。 curl -X GET --header“授权:不记名xxxxxxxx(IAM令牌约1200个字符)”“ https:// https://gateway-syd.watsonplatform.net/speech-to-text/api/v1 / ...

回答 2 投票 0

Azure Speech SDK语言使用python从流中转换为文本

我正在尝试将UI的流作为流发送到UI。我需要python Azure语音逻辑将语音转换为文本。我不确定如何在语音中使用pull / pusha音频输入流...

回答 1 投票 0

无法将音频文件读取为PCM WAV,AIFF / AIFF-C或本机FLAC

我正在使用.wav格式的javascript录制语音:navigator.mediaDevices.getUserMedia({audio:true}).then(stream => {handlerFunction(stream)})函数handlerFunction(...

回答 1 投票 1

语音转换为文本-PyAudio替代项

除了在Python中使用PyAudio之外,还有其他有效的方法可以识别语音并将其转换为文本吗?我听说PyAudio在计算机中搜索麦克风,但无法在服务器上运行。可以...

回答 1 投票 0

如何在Android上通过按钮停止语音识别?

我目前使用RecognizerIntent在Android应用上执行STT。当用户单击按钮时,会弹出Google语音输入屏幕,用户可以说出来并被转录。当它足够安静时,...

回答 1 投票 1

如何更改Android语音语言理解(LUIS)SDK的端点?

我已经在luis.ai和eu.luis.ai上都建立了一个应用程序。我正在使用此存储库中提供的SDK将其用于语音识别:https://github.com/Azure-Samples/Cognitive-Speech-STT -...

回答 1 投票 0

Google云语音到文本的长音频响应

我正在尝试将音频转换为文本,但得到的结果是LongRunningRecognizeResponse {结果:[]}这是我的函数,const audio = {uri:`gs:// $ {BUCKET} / $ {fileName}`, }; const ...

回答 1 投票 0


WebSocket升级失败,使用azure.cognitiveservices.speech发出了错误的请求(400)

我使用Microsoft的语音转文本服务的任何方法都无法让我给出错误消息:语音识别已取消:CancellationReason.Error错误详细信息:WebSocket升级失败,并显示错误...

回答 1 投票 0

是否可以从一个帐户同时执行两个语音转文本流?

所以问题就在标题上,我可以创建语音到文本流给一个用户,并且效果很好,但是当我尝试连接第二个用户时,它对所有人都不利,有时对一个用户也不错,所以.. 。

回答 1 投票 0

如何使用Node.js将WAV文件转换为8000hz

我曾尝试使用nodejs将语音wav文件转换为文本,但显示如下错误:错误:数据:'{\ n“错误”:“此8000hz音频输入需要窄带模型。” \ n}',代码:...

回答 1 投票 1

如何使用Librosa或Kaldi将音频转换为文本?

在Windows上,您可以从this repo安装vosk:

回答 1 投票 1

wave.Error:未知格式:尝试将wav文件转换为Python中的文本时出现3

我需要从麦克风录制音频并将其转换为文本。我已尝试使用从网上下载的多个音频片段进行此转换过程,并且效果很好。但是当我尝试...

回答 1 投票 0

两个人在微音上的转录到文本(语音到文本的天蓝色认知服务)

我正在尝试使用Azure的SpeechToText认知服务通过麦克风转录两个人的实时对话。问题是认知服务样本中的哪种情况最适合...

回答 1 投票 0

使用Microsoft Speech to text REST API时,获取400- OGG文件格式的错误请求

我正在使用Microsoft Azure语音文本发送REST API。根据文档,REST API支持Ogg和Wav格式。但是,当我发送对OGG音频文件的请求时,得到400-错误...

回答 1 投票 1

Android Studio,等待一行代码完成,然后再开始下一个

初学者问题...我有以下4行代码。第三行询问用户(带语音)他/她是否对某个动作有把握。然后第四行调用一个称为...

回答 1 投票 1

如何从Azure Cognitive Services为现有的Docker容器创建IoT Edge模块?

我目前具有作为Docker容器使用的用于语音到文本的Azure认知服务的公共预览访问权限。这允许容器在IoT Edge设备上运行,而不是访问...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.