从Azure Speech到Text Rest API创建语音服务

我可以在Microsoft文档链接中看到用于语音到文本的REST API端点的两个版本。

[https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription和https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-speech-to-text

一个端点是[https：//.api.cognitive.microsoft.com/sts/v1.0/issueToken]，引用版本1.0，另一个端点是[api / speechtotext / v2.0 / transcriptions]，引用版本2.0 。如何在Azure门户中为后者创建语音转文本服务？

[每当我在不同地区创建服务时，它总是创建语音到文本v1.0。

任何提示？

PS：我的Visual Studio Enterprise帐户具有每月津贴，我正在创建订阅（s0）（付费）服务，而不是免费（试用）（f0）服务。

谢谢，厄兹古尔

0
投票

理解您的困惑，因为MS文档对此含糊不清。根据我的研究，让我对其进行以下澄清：存在两种语音到文本服务，v1和v2。

v1在创建时可以在认知服务结构下找到：

基于Speech-to-text REST API document中的语句：

使用语音转文本REST API之前，请了解：

使用REST API并直接传输音频的请求只能最多包含60秒的音频。
语音转文本REST API仅返回最终结果。部分的未提供结果。

如果您的应用要求发送更长的音频，考虑使用Speech SDK或基于文件的REST API，例如批处理转录。

因此v1对文件格式或音频大小有一些限制。如果您还有更多要求，请导航到Zoom Media托管的v2 api批处理转录。如果您从ZM阅读此document，则可以弄清楚。您可以在Azure市场中创建该Speech Api：

这是它的创建页面：

另外，您可以在上一页的底部查看API文档，它是V2 api document。

最后提示：

v1的端点，例如：https://eastus.api.cognitive.microsoft.com/sts/v1.0/issuetoken

v2的端点，例如：

希望我对此很清楚！

问题描述投票：0回答：1

1个回答

最新问题

从Azure Speech到Text Rest API创建语音服务

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1