将此标记用于Azure认知服务和实验室相关问题,包括视觉,语音,语言,知识和搜索API以及SDK。
在后端使用 Azure Speechsdk.transcription.ConversationTranscriber 处理来自 Web 应用程序的数据时出现问题
我正在尝试实现如下流程: JS Web 应用程序使用 WebAudio API 持续捕获音频(getUserMedia,然后处理 MediaRecorder) 单通道音频正在继续发送...
Document Intelligence Studio 在处理 OCR(手写)时提供高延迟
我们正在使用 Document Intelligence Studio 从 pdf 中检索数据。尝试使用 API 调用 uisng python 进行同样的操作,也没有产生任何结果 API 版本:2024-02-29(预览版)。 数量...
我有一个索引器,可以读取 blob 存储、块,并将数据矢量化为索引。这很好用。我还有一个关键字段,我们称之为存储在元数据中的 fileID ...
Azure 计算机视觉对付费层中的图像强制执行 4mb 限制?
我目前正在使用 Azure 计算机视觉(读取和分析 API)。 文档规定,免费套餐中的图像必须为 4mb,付费套餐中的图像必须为 50mb。 https://westus.dev.cognitive.microsoft.com/docs/
我们可以将 Azure Form Recognizer Studio 界面直接集成到我们的应用程序中吗?
据我所知,Form Recognizer Studio 是一个在线工具,用于直观地探索、理解 Form Recognizer 服务的功能并将其集成到您的应用程序中。但是我们可以整合工作室吗
我正在尝试训练一个模型,但是,我的数据集的一个字段是可选的。分析文档时,模型没有返回预期结果。 蓝色字段代表我正在尝试的字段...
如何获取扬声器输出的媒体流,以通过网络将其传输到 Microsoft 认知服务,以实现实时语音转文本
困难似乎在于访问扬声器,而不是实际的 JS 语音 SDK 代码。 如果我能以某种方式将扬声器放入 MediaStream,那么我就可以使用代码 AudioConfig。
如标题。 我使用“导入和矢量化数据”来创建索引,并且索引会自动分块。 索引架构如下; “价值”: [ { “@search.score”: &...
处理来自字节流或文件的音频,而不保存到磁盘 Azure 语音 SDK Python
我有一个 Flask 应用程序,它将音频文件作为表单数据发布,我们希望使用 Azure Speech SDK 处理这些音频文件,以从语音中提取文本。 但为了提高性能,我想...
我需要使用 WSL 在我的桌面计算机上创建并运行 Azure 空间分析容器。我遵循了本教程:https://learn.microsoft.com/en-us/azure/ai-services/computer-vision/spatial-anal...
Microsoft Azure Translator API 可以翻译带有 HTML 标签的文本吗?
我正在尝试使用 Azure 翻译器 API 来翻译具有 HTML 标签的文本。翻译是从英语到芬兰语或丹麦语。 我注意到,对于一种情况 href 标签,它没有翻译它,它
我使用 Azure 的语音工作室训练、创建和部署了自定义语音模型。 在“部署模型”页面上,我获得了资源密钥、服务区域和端点 ID。我使用了端点 ID(我是...
运行快速入门代码时出现 Azure Face 服务无效请求 API 错误
我一直在尝试通过Python使用Azure人脸服务,并从官方网站复制粘贴了代码。 (https://learn.microsoft.com/en-us/azure/cognitive-services/computer-vision/
在 ReactJS 应用程序中使用 Azure AI 沉浸式阅读器
我正在尝试在ReactJS应用程序中使用Azure IA沉浸式阅读器。 我已在 Azure 门户上创建了资源 我有沉浸式读者资源的关键和端点。 尝试使用“@microsoft/immersive-
为什么 Azure 认知搜索索引器不必要地创建 Base64 名称?
我正在尝试在 Azure 认知搜索上使用本机软 Blob 删除(根据 https://learn.microsoft.com/en-us/azure/search/search-howto-index-changed-deleted-blobs)当文件被删除时删除...
无法使用 Azure SplitSkill 以编程方式模拟 Azure 中的手动文档拆分
我将从在 Azure 中手动设置 RAG 解决方案转向使用 azure python sdk 以编程方式设置所有内容。我有一个包含单个 pdf 的容器。当手动设置时...
如何使用注释在 Syncfusion React PDF 视图中设置边界
我有 Syncfusion React PDF 查看器,并使用 Azure 认知服务执行 OCR。 当用户在 PDF 文件中搜索时,Azure 服务将返回边界。使用这些界限,我...
如何通过 python 脚本为现有服务设置默认的 LLM_RAG_CRACK_AND_CHUNK_AND_EMBED 设置?
我看到这里有一个默认设置。如何为我现有的服务进行设置?有人能指出正确的教程/模板吗?我有以下代码: 来自 休息
我正在尝试识别不同的发言者 ID,并希望显示他们的对话及其 ID/姓名。这是我的代码。但我在这一行遇到错误 'var seller = e.Result.Properties.GetProperty(
如果我在 azure openai 上使用添加自己的数据并使用 blob 存储,如果我更新 blob 存储中的数据会怎么样,它将如何在聊天机器人上更新它
当利用 Azure OpenAI 并通过 Blob 存储合并我自己的数据时,我很好奇更新 Blob 存储中的数据的过程以及它如何影响