azure-cognitive-services 相关问题

将此标记用于Azure认知服务和实验室相关问题,包括视觉,语音,语言,知识和搜索API以及SDK。

Azure 表单识别;货币检测似乎不太准确,api版本:2024-02-29-preview

想知道是否有人遇到过这种情况和/或知道一种使货币检测更准确的方法。 我有一个可以扫描发票的应用程序。 所附发票为 CHF(瑞士法郎),但

回答 1 投票 0

创建 Azure OpenAI 验证失败

我访问Azure OpenAI服务的申请已获得批准。我尝试在资源组中创建新的 Azure OpenAI 资源但失败。 当我创建 Azure Open AI 资源时,它...

回答 1 投票 0

使用 Azure TTS 读取字节 AudioDataStream 并播放

我不明白如何在 python 中读取 TTS azure 服务的字节流 - 并重新播放流 来自文档:https://learn.microsoft.com/en-us/python/api/azure-cognitiveservices-

回答 1 投票 0

如何在 Azure CognitiveServices SDK 中将 SpeechSynthesizer 对象的文本音量更改为语音音量,而不更改 c# 中的系统音量

我正在使用 C# 和文本转语音 Azure SDK。相对于其他声音来说,声音非常大,这是一个问题。除非我只能更改 TTS 音量,否则我无法使用此功能。我发现...

回答 1 投票 0

使用 Azure TTS 读取字节 AudioDataStream

我不明白如何在 python 中读取 TTS azure 服务的字节流。 来自文档:https://learn.microsoft.com/en-us/python/api/azure-cognitiveservices-speech/azure.cognitiveservices。

回答 1 投票 0

维护源语言中 Markdown 元数据的键

这个问题涉及 Microsoft 认知服务,特别是他们的 Azure AI 翻译服务。翻译器公开了两种类型的文档翻译 API: 异步翻译API 同步

回答 1 投票 0

如何在认知搜索中创建 TEXTSPLIT 技能以及如何在索引器中引用它

我不知道如何创建文本拆分技能并在索引器中引用它 我在导入数据后创建了一个索引器,并使用了内置技能,例如语言检测和关键阶段提取...

回答 1 投票 0

将字节数组发送到语音转文本 API (Azure)

我正在浏览器上录制语音并将其发送到我的 API,该 API 会将数据发送到 Speech-To-Text API (Azure)。 我不断从 API 获取 NoMach。 这是我的浏览器代码: 让语言Co...

回答 1 投票 0

在后端使用 Azure Speechsdk.transcription.ConversationTranscriber 处理来自 Web 应用程序的数据时出现问题

我正在尝试实现如下流程: JS Web 应用程序使用 WebAudio API 持续捕获音频(getUserMedia,然后处理 MediaRecorder) 单通道音频正在继续发送...

回答 1 投票 0

Document Intelligence Studio 在处理 OCR(手写)时提供高延迟

我们正在使用 Document Intelligence Studio 从 pdf 中检索数据。尝试使用 API 调用 uisng python 进行同样的操作,也没有产生任何结果 API 版本:2024-02-29(预览版)。 数量...

回答 1 投票 0

Azure AI 搜索索引 - 多个索引器和分块

我有一个索引器,可以读取 blob 存储、块,并将数据矢量化为索引。这很好用。我还有一个关键字段,我们称之为存储在元数据中的 fileID ...

回答 1 投票 0

Azure 计算机视觉对付费层中的图像强制执行 4mb 限制?

我目前正在使用 Azure 计算机视觉(读取和分析 API)。 文档规定,免费套餐中的图像必须为 4mb,付费套餐中的图像必须为 50mb。 https://westus.dev.cognitive.microsoft.com/docs/

回答 3 投票 0

我们可以将 Azure Form Recognizer Studio 界面直接集成到我们的应用程序中吗?

据我所知,Form Recognizer Studio 是一个在线工具,用于直观地探索、理解 Form Recognizer 服务的功能并将其集成到您的应用程序中。但是我们可以整合工作室吗

回答 2 投票 0

如何训练 Azure 表单识别器识别可选字段?

我正在尝试训练一个模型,但是,我的数据集的一个字段是可选的。分析文档时,模型没有返回预期结果。 蓝色字段代表我正在尝试的字段...

回答 2 投票 0

如何获取扬声器输出的媒体流,以通过网络将其传输到 Microsoft 认知服务,以实现实时语音转文本

困难似乎在于访问扬声器,而不是实际的 JS 语音 SDK 代码。 如果我能以某种方式将扬声器放入 MediaStream,那么我就可以使用代码 AudioConfig。

回答 1 投票 0

如何在分块的 Azure AI 搜索索引中返回图像

如标题。 我使用“导入和矢量化数据”来创建索引,并且索引会自动分块。 索引架构如下; “价值”: [ { “@search.score”: &...

回答 2 投票 0

处理来自字节流或文件的音频,而不保存到磁盘 Azure 语音 SDK Python

我有一个 Flask 应用程序,它将音频文件作为表单数据发布,我们希望使用 Azure Speech SDK 处理这些音频文件,以从语音中提取文本。 但为了提高性能,我想...

回答 1 投票 0

运行 Azure 空间分析容器时出现问题

我需要使用 WSL 在我的桌面计算机上创建并运行 Azure 空间分析容器。我遵循了本教程:https://learn.microsoft.com/en-us/azure/ai-services/computer-vision/spatial-anal...

回答 1 投票 0

Microsoft Azure Translator API 可以翻译带有 HTML 标签的文本吗?

我正在尝试使用 Azure 翻译器 API 来翻译具有 HTML 标签的文本。翻译是从英语到芬兰语或丹麦语。 我注意到,对于一种情况 href 标签,它没有翻译它,它

回答 1 投票 0

Azure 神经语音:部署 ID 无效

我使用 Azure 的语音工作室训练、创建和部署了自定义语音模型。 在“部署模型”页面上,我获得了资源密钥、服务区域和端点 ID。我使用了端点 ID(我是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.