speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。

如何评估ASR(自动语音识别)中的WER(单词错误率)?

如何评估ASR(自动语音识别)中的WER(单词错误率)? 例如,如果我有 ASR 的句子和输出(人工参考翻译)。 我知道方程式,但我知道...

回答 4 投票 0

Azure openai 语音转文本 -Whisper“代码”:“404”,“消息”:“找不到资源”

我正在尝试通过 Azure openai 密钥、端点、部署使用耳语来转录音频文件 尽管我通过部署在有效区域中进行耳语并使用他们的

回答 1 投票 0

Python语音识别转换mp3文件时出错

我第一次尝试音频转文本。 将语音识别导入为 sr r = sr.Recognizer() 以 sr.AudioFile("/path/to/.mp3") 作为源: 音频 = r.record(源) 当我执行上面的代码时,

回答 3 投票 0

Azure 语音分类无法正确标记说话者,直到说出 7 秒长的语句为止

用于分类的 Azure 语音私人预览版之前设置了“未知”演讲者标签,直到它识别出演讲者长达 7 秒的声明,并在公共预览版中的 api 中开始标记

回答 1 投票 0

INVALID_ARGUMENT:请求负载大小超出限制:10485760 字节

我第一次在项目中使用 GCS Speech API 将一系列音频文件转换为文本。每个文件大约有60分钟,并且是一个人在整个过程中不断地说话......

回答 2 投票 0

Android SpeechRecognizer 启用格式/标点符号

有人尝试过实现Android SpeechRecognizer识别结果的自动文本格式化(标点符号)吗? 这里有描述。 根据文档它应该是

回答 1 投票 0

c# 中的语音到文本 chirp 模型问题

我正在尝试使用 dotnet Google.Cloud.Speech.V2 库运行“chirp”模型的转录。我需要使用 chirp,因为我需要用波兰语标点符号进行转录,而 chirp 是...

回答 1 投票 0

Azure 语音转文本显示“录音 URI 包含无效数据”

我正在尝试转录音频中的文本,我使用的是azure提供的代码: https://github.com/Azure-Samples/cognitive-services-speech-sdk/blob/master/samples/batch/python/python-client...

回答 1 投票 0

azure 认知服务演讲没有按我的预期工作

我想将文件的脚本保存到txt文件中,但该文件创建为空。 这是代码 Speech_config = Speechsdk.SpeechConfig(订阅=speech_key,region=service_region) 音频_c...

回答 1 投票 0

创建基于 Azure 的 AI 助手,用于会议转录和摘要

我正在寻求见解,以创建一个基于Azure的AI助手,它可以应邀参加会议、听取讨论、转录内容并提供摘要。 例如,人工智能

回答 1 投票 0

在我的 Next.js 项目中从 openai Speech-To-Text Whisper 获取失败

我正在将 t3-app 与 Next.js 应用程序路由器一起使用。 我将使用服务器操作形式将音频文件上传到 opanai 语音转文本模型。每次我上传 .mp3 文件时,我都无法获取转录...

回答 1 投票 0

使用 OpenAI 的 Whisper 转录降噪音频时的时序偏移

我正在开展一个项目,涉及使用 OpenAI 的 Whisper 转录音频文件。为了提高转录质量,我尝试使用

回答 1 投票 0

Azure Speech SDK 转录音频问题

我正在尝试使用 Azure 语音转文本 SDK 添加另一种将语音转录为文本的方法到此 npm lib https://github.com/Rei-x/discord-speech-recognition。我尝试使用 api 但也...

回答 1 投票 0

使用 React Native 社区语音功能将语音转换为文本时出现错误

我正在尝试构建一个具有语音转文本功能的人工智能助手应用程序。我正在使用 React Native 社区/语音包来实现此功能,但当我尝试捕获语音时,它显示此错误...

回答 1 投票 0

Azure - 语音转文本 - 检测扬声器通道

我正在使用 Azure Speech To Text - 连续识别来转录音频文件。我将立体声 wav 文件中的扬声器分成左声道和右声道。然而,当我运行转录时...

回答 1 投票 0

有没有办法使用microsoft azure语音认知sdk检测语音开头?

我正在使用“microsoft-cognitiveservices-speech-sdk”:“^1.32.0”库来实现 STT 功能。 我想检测用户是否在上一次 STT 完成后 2-3 秒内再次说话。 装备...

回答 2 投票 0

如何获取支持语音或口音的 flutter 文本转语音和 flutter 语音转文本列表?

我找不到flutter文本转语音和语音转文本支持的语言语音(重音) 我想获取支持的语音列表及其语言和国家/地区代码

回答 2 投票 0

将转录文本与音频中的特定时间戳对齐

在 Azure 中是否可能,或者 Azure 中是否有服务可以用来根据源视频的口语获取每个纯文本的位置? 基本上,我有一个纯文本可以...

回答 1 投票 0

导入 DeepSpeech 错误:找不到模块错误

我正在尝试安装 DeepSearch 库,以便我可以使用预训练模型来构建语音转文本项目。 ModuleNotFoundError Traceback(最近一次调用最后一次) 在...

回答 1 投票 0

从 wav 文件或处理后的原始音频缓冲区进行语音识别

我正在开发一个 Android 项目,我需要从音频缓冲区原始数据或存储的 wav 文件中将语音转换为文本。在安卓上可以做到这一点吗?更具体地说,我得到音频缓冲区...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.