speech 相关问题

言语是人类交流的发声形式。

Python 语音识别在处理短发音单词时遇到问题

我有一个项目,我正在使用语音识别模块。我注意到识别器在处理短发音单词的输入时遇到问题,例如“next”、“search”、“...

回答 1 投票 0

通过 Wifi 传输语音流

我一直在尝试通过 wifi HTTP TCP/IP 以 16Khz 传输语音(可能扩展到音频)。考虑到 ESP8266 wifi 模块与 Arduino 和其他平台的兼容性,我开始使用 ESP8266 wifi 模块...

回答 1 投票 0

设置 SFSpeechAudioBufferRecognitionRequest.requiresOnDeviceRecognition = true 时接收错误“Domain=kAFAssistantErrorDomain Code=1101”

如果我设置 SFSpeechAudioBufferRecognitionRequest.requiresOnDeviceRecognition = true,我将收到下一个错误:Error Domain=kAFAssistantErrorDomain Code=1101。 为了测试它,你可以

回答 2 投票 0

如何在简单语音示例应用程序(ATT 语音 API)中添加凭据

如何在speechConfig.m(一个简单的语音示例应用程序ATT语音API)中添加凭据? /** 取消混淆应用程序的 OAuth client_id 凭证。 **/ NSString* SpeechOAuthKey(...

回答 1 投票 0

用于语音转文本(语音识别)iPhone 的 API 或 SDK

我想要一个语音识别API或SDK来识别用户所说的语音并给出它的文本形式。 详细说明如下: 在我的应用程序中,我需要播放音频...

回答 3 投票 0

Librosa 抛出 ValueError

x_val, s_rate = librosa.load(文件名, sr=采样率) 文件“/python3.6/site-packages/librosa/core/audio.py”,第 140 行,位于 加载 y = sf_desc.read(frames=frame_duration, dtype=dtype,

回答 1 投票 0

语音识别Python出现奇怪的请求错误

以下代码的语音识别根本不起作用 以 sr.Microphone() 作为源: # 从默认麦克风读取音频数据 音频= r.record(源,持续时间= 4) 打印(“

回答 2 投票 0

Azure Speech SDK 使用 golang 将语音转换为流中的文本

在 golang 中使用 Azure Speech SDK 语音转文本时。 我想使用流中的数据 但输出超时。 如何修复它? base64Data := "xxxx" audioBytes,错误:= base64.StdEncoding.DecodeSt...

回答 1 投票 0

将转录文本与音频中的特定时间戳对齐

在 Azure 中是否可能,或者 Azure 中是否有服务可以用来根据源视频的口语获取每个纯文本的位置? 基本上,我有一个纯文本可以...

回答 1 投票 0

Swift:沉默 x 秒后停止语音识别

我一直在寻找解决方案,但我看到的所有解决方案都很令人困惑,所以我想我应该创建一个新问题。 我正在使用语音库,我希望识别任务在 2 秒后停止

回答 3 投票 0

识别音频文件中的重复句子

我正在寻找有关识别音频文件中重复语音片段的最佳方法的信息。 假设有人正在录制自己说的文字,有时他会被一句话噎住......

回答 1 投票 0

是否可以“按您所说”转录 Twilio 通话?

有谁知道 Twilio 是否可以在通话期间根据一种音频标志或模式(例如静音)创建多个音频记录。这样您就可以触发回调...

回答 2 投票 0

在 RPi3B+ 上使用 Google Cloud SpeechRecognition 和 python 3.9 实现 80 秒延迟

我正在使用PyPi代码(https://pypi.org/project/SpeechRecognition/) 清理后仅使用 Google Cloud SpeechRecognition。 Google Json Credentials 在 shell 环境中并且正常工作。 我已经...

回答 1 投票 0

如何根据不同的说话者分离音频文件

我有一堆关于电话交谈的音频文件。我想尝试将一个音频文件分成两个,每个文件只包含一个演讲者的讲话。也许我需要使用语音分类。但如何...

回答 2 投票 0

如何在Python中将文本转换为语音

我现在想知道如何在Python中将文本转换为语音。 在.NET中我使用了 暗淡SAPI Msg = '嗨,这是一个测试' SAPI = CreateObject("sapi.spvoice") SAPI.Speak(消息)

回答 8 投票 0

Google Speech-To-Text v2 不接受 Node.JS 中的音频

我已经尝试了几天使用 Node.JS 迁移到 Google STT V2。在 v1 中一切都很完美。我创建了一个识别器并使用 https://github.com/

回答 1 投票 0

TENSORFLOW 语音命令:解码 wav 时出现错误(尝试读取字符串时数据太短)

感谢您的帮助。 我正在学习张量流上的tuturial(语音命令),在我下载代码和数据集之后,我运行程序,经过几个步骤的训练,出现错误...

回答 3 投票 0

如何中断应用程序中文本语音合成的播放?

这是我用来语音richTextBox 的代码。我的问题是,在播放文本时我无法单击任何内容。我什至无法停止玩。我该如何解决这个问题?有什么办法可以...

回答 3 投票 0

为什么字信息丢失(WIL)是这样计算的?

单词信息丢失 (WIL) 是衡量自动语音识别 (ASR) 服务(例如 AWS Transcribe、Google Speech-to-Text 等)相对于黄金标准(通常是人类 -

回答 1 投票 0

C# - 免费的离线语音识别库 (SDK)

C# - 免费语音识别引擎库 (SDK) System.Speech.Recognition 非常糟糕...我想要另一个 SDK 可以给我很好的结果并在 Visual Studio 上使用 c#... 我想要离线...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.