将此标记用于Azure认知服务和实验室相关问题,包括视觉,语音,语言,知识和搜索API以及SDK。
Azure 表单识别;货币检测似乎不太准确,api版本:2024-02-29-preview
想知道是否有人遇到过这种情况和/或知道一种使货币检测更准确的方法。 我有一个可以扫描发票的应用程序。 所附发票为 CHF(瑞士法郎),但
我访问Azure OpenAI服务的申请已获得批准。我尝试在资源组中创建新的 Azure OpenAI 资源但失败。 当我创建 Azure Open AI 资源时,它...
使用 Azure TTS 读取字节 AudioDataStream 并播放
我不明白如何在 python 中读取 TTS azure 服务的字节流 - 并重新播放流 来自文档:https://learn.microsoft.com/en-us/python/api/azure-cognitiveservices-
如何在 Azure CognitiveServices SDK 中将 SpeechSynthesizer 对象的文本音量更改为语音音量,而不更改 c# 中的系统音量
我正在使用 C# 和文本转语音 Azure SDK。相对于其他声音来说,声音非常大,这是一个问题。除非我只能更改 TTS 音量,否则我无法使用此功能。我发现...
使用 Azure TTS 读取字节 AudioDataStream
我不明白如何在 python 中读取 TTS azure 服务的字节流。 来自文档:https://learn.microsoft.com/en-us/python/api/azure-cognitiveservices-speech/azure.cognitiveservices。
这个问题涉及 Microsoft 认知服务,特别是他们的 Azure AI 翻译服务。翻译器公开了两种类型的文档翻译 API: 异步翻译API 同步
如何在认知搜索中创建 TEXTSPLIT 技能以及如何在索引器中引用它
我不知道如何创建文本拆分技能并在索引器中引用它 我在导入数据后创建了一个索引器,并使用了内置技能,例如语言检测和关键阶段提取...
我正在浏览器上录制语音并将其发送到我的 API,该 API 会将数据发送到 Speech-To-Text API (Azure)。 我不断从 API 获取 NoMach。 这是我的浏览器代码: 让语言Co...
在后端使用 Azure Speechsdk.transcription.ConversationTranscriber 处理来自 Web 应用程序的数据时出现问题
我正在尝试实现如下流程: JS Web 应用程序使用 WebAudio API 持续捕获音频(getUserMedia,然后处理 MediaRecorder) 单通道音频正在继续发送...
Document Intelligence Studio 在处理 OCR(手写)时提供高延迟
我们正在使用 Document Intelligence Studio 从 pdf 中检索数据。尝试使用 API 调用 uisng python 进行同样的操作,也没有产生任何结果 API 版本:2024-02-29(预览版)。 数量...
我有一个索引器,可以读取 blob 存储、块,并将数据矢量化为索引。这很好用。我还有一个关键字段,我们称之为存储在元数据中的 fileID ...
Azure 计算机视觉对付费层中的图像强制执行 4mb 限制?
我目前正在使用 Azure 计算机视觉(读取和分析 API)。 文档规定,免费套餐中的图像必须为 4mb,付费套餐中的图像必须为 50mb。 https://westus.dev.cognitive.microsoft.com/docs/
我们可以将 Azure Form Recognizer Studio 界面直接集成到我们的应用程序中吗?
据我所知,Form Recognizer Studio 是一个在线工具,用于直观地探索、理解 Form Recognizer 服务的功能并将其集成到您的应用程序中。但是我们可以整合工作室吗
我正在尝试训练一个模型,但是,我的数据集的一个字段是可选的。分析文档时,模型没有返回预期结果。 蓝色字段代表我正在尝试的字段...
如何获取扬声器输出的媒体流,以通过网络将其传输到 Microsoft 认知服务,以实现实时语音转文本
困难似乎在于访问扬声器,而不是实际的 JS 语音 SDK 代码。 如果我能以某种方式将扬声器放入 MediaStream,那么我就可以使用代码 AudioConfig。
如标题。 我使用“导入和矢量化数据”来创建索引,并且索引会自动分块。 索引架构如下; “价值”: [ { “@search.score”: &...
处理来自字节流或文件的音频,而不保存到磁盘 Azure 语音 SDK Python
我有一个 Flask 应用程序,它将音频文件作为表单数据发布,我们希望使用 Azure Speech SDK 处理这些音频文件,以从语音中提取文本。 但为了提高性能,我想...
我需要使用 WSL 在我的桌面计算机上创建并运行 Azure 空间分析容器。我遵循了本教程:https://learn.microsoft.com/en-us/azure/ai-services/computer-vision/spatial-anal...
Microsoft Azure Translator API 可以翻译带有 HTML 标签的文本吗?
我正在尝试使用 Azure 翻译器 API 来翻译具有 HTML 标签的文本。翻译是从英语到芬兰语或丹麦语。 我注意到,对于一种情况 href 标签,它没有翻译它,它
我使用 Azure 的语音工作室训练、创建和部署了自定义语音模型。 在“部署模型”页面上,我获得了资源密钥、服务区域和端点 ID。我使用了端点 ID(我是...