speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。

识别音频文件中的重复句子

我正在寻找有关识别音频文件中重复语音片段的最佳方法的信息。 假设有人正在录制自己说的文字,有时他会被一句话噎住......

回答 1 投票 0

尝试构建一个将实时语音转换为文本的应用程序

我一直在尝试使用React js作为前端和Python Flask作为后端来创建实时语音文本。使用套接字在这些之间连接以发送实时数据我尝试了很多方法......

回答 1 投票 0

如何等待说话者沉默1分钟后再开始识别

我希望天蓝色语音转文本服务在开始识别语音之前等待至少 1 分钟。或者演讲者自己在完成演讲后点击按钮,然后蓝色演讲...

回答 1 投票 0

语音转文字 Angular

我想使用 Angular 进行语音合成。就像在这个项目中一样: https://codesandbox.io/s/rmloxx60q4 然而,我的角度项目中的“从‘speak-tts’导入语音”引发了以下问题......

回答 1 投票 0

获取 Android 13 上 Google SpeechRecognizer (GoogleTTSRecognitionService) 支持的语言列表

在android 13之前,我可以使用意图RecognizerIntent.ACTION_GET_LANGUAGE_DETAILS通过广播接收器成功获取支持的语言。在 Android 13 上,额外内容为空。代码如下: 公开

回答 2 投票 0

如何从SFSpeechRecognitionResult获取最后一个口语单词

我正在实现一个语音识别过程,以使用 SFSpeechRecognizer 进行转换。需要实现擦除选项来删除最后一个字符。但是 SFSpeechRecognitionResult、result.bestTranscript...

回答 1 投票 0

属性错误:使用 AudioSegment get_file() 命令时引发“NoneType”对象没有属性“read”

我目前正在从事一个语音转文本项目。我尝试了以下视频中的代码 “https://www.youtube.com/watch?v=B5A1bMi4dJI”,并收到: 第 29 行,在 c...

回答 1 投票 0

使用react-native-community/voice在React Native中进行语音到文本

我想将语音转换为文本,并借助语音识别获取文本结果。 我正在使用react-native-community/voice(示例) 构建项目并在我的上安装 apk 后...

回答 2 投票 0

如何在推理模式下使用 Fairseq 模型?

我使用 Fairseq 库构建了一个语音到文本翻译模型。现在我想在推理模式下使用它,而不使用 fairseq-generate 命令行。我该如何处理? 预先感谢

回答 1 投票 0

Azure 语音识别器给我有关标题的错误

我正在尝试使用 Azure 语音识别器服务进行语音转文本,但是当我运行此代码时,出现错误 代码是; 将 azure.cognitiveservices.speech 导入为peechsdk subscription_key = "密钥在这里&

回答 1 投票 0

GCP 语音转文本 API 拒绝下载转录导出文件(所有类型)

Speech-to-txt API 拒绝下载转录导出文件(所有类型),因为当我单击下载时,它没有显示任何内容,甚至没有更改我的浏览器/清理历史记录/cookie 等...如下图所示。 我...

回答 1 投票 0

Azure 认知服务的语音服务 (SST) 支持哪些音频格式?

请记住,据我所知,Microsoft/Azure 认知服务的“语音服务”目前正在进行合理化练习 https://learn.microsoft.co...

回答 1 投票 0

如何将 Amazon Transcribe json 响应转换为字幕格式(srt、webvvt 等)?

尝试找到一个包来转换来自 Amazon AWS Transcribe 服务的 json 响应,但没有成功。 您可以在 Fiddle 的 JavaScript 部分查看 JSON 示例。 我不喜欢...

回答 10 投票 0

如何在没有事先语音注册的情况下使用 Microsoft 语音转文本进行说话者识别(分类)?

在我的应用程序中,我需要录制人与人之间的对话,而物理工作流程中没有空间对每个人的声音进行 20 秒的采样以用于训练识别...

回答 3 投票 0

Google 语音转文本是否会消耗互联网数据来进行 Python 中的静默音频输入?

我目前正在使用Python的语音识别库和Google的语音到文本功能。我担心的是在音频处理过程中没有检测到语音的情况。

回答 1 投票 0

OpenAI Whisper 无法处理过去几秒的 IOS 录音

我正在将录音发送到 OpenAI Whisper API,但无法让移动录音接受过去几秒钟的数据,我不知道为什么。桌面录音功能完美但是

回答 1 投票 0

我正在使用 Whisper 进行转录,但出现以下错误,无法找出问题所在

我正在使用 Whisper 转录音频文件。我已经安装了Python3.9、ffmpeg和相关依赖项,以及openai-whisper==20230308。我可以导入耳语,但是当我尝试运行反式时......

回答 1 投票 0

flutter 语音转文本插件自动停止捕获音频

我使用语音转文本小部件在 flutter 中实现了语音转文本服务。它基本上会监听用户所说的内容,当他说句号时,它应该发送捕获的句子......

回答 1 投票 0

在 google colab 上运行时未找到 Deepspeech 模块

我需要将 Deepspeech 0.6.1 安装到我的系统中以进行自动语音识别项目。因此,按照我导师的指导,我使用了所有这些代码 [ !pip 安装 deepspeech==0.6.1 !apt-get 安装...

回答 1 投票 0

React Native - 无法同时使用语音转文本和文本转语音

我正在使用react-native-voice和expo-speech库来转录我的声音并将文本转换为语音。问题是,当我结束注册我的声音并开始使用 expo-v 演讲时......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.