从Azure Speech到Text Rest API创建语音服务

问题描述 投票:0回答:1

我可以在Microsoft文档链接中看到用于语音到文本的REST API端点的两个版本。

[https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcriptionhttps://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-speech-to-text

一个端点是[https://.api.cognitive.microsoft.com/sts/v1.0/issueToken],引用版本1.0,另一个端点是[api / speechtotext / v2.0 / transcriptions],引用版本2.0 。如何在Azure门户中为后者创建语音转文本服务?

[每当我在不同地区创建服务时,它总是创建语音到文本v1.0。

任何提示?

PS:我的Visual Studio Enterprise帐户具有每月津贴,我正在创建订阅(s0)(付费)服务,而不是免费(试用)(f0)服务。

谢谢,厄兹古尔

azure speech-to-text microsoft-cognitive
1个回答
0
投票

理解您的困惑,因为MS文档对此含糊不清。根据我的研究,让我对其进行以下澄清:存在两种语音到文本服务,v1v2

v1在创建时可以在认知服务结构下找到:

enter image description here

基于Speech-to-text REST API document中的语句:

使用语音转文本REST API之前,请了解:

  • 使用REST API并直接传输音频的请求只能最多包含60秒的音频。
  • 语音转文本REST API仅返回最终结果。部分的未提供结果。

如果您的应用要求发送更长的音频,考虑使用Speech SDK或基于文件的REST API,例如批处理转录。

因此v1对文件格式或音频大小有一些限制。如果您还有更多要求,请导航到Zoom Media托管的v2 api批处理转录。如果您从ZM阅读此document,则可以弄清楚。您可以在Azure市场中创建该Speech Api:

enter image description here

这是它的创建页面:

enter image description here

另外,您可以在上一页的底部查看API文档,它是V2 api document

最后提示:

v1的端点,例如:https://eastus.api.cognitive.microsoft.com/sts/v1.0/issuetoken

v2的端点,例如:

enter image description here

希望我对此很清楚!

© www.soinside.com 2019 - 2024. All rights reserved.