我可以在Microsoft文档链接中看到用于语音到文本的REST API端点的两个版本。
[https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription和https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-speech-to-text
一个端点是[https://.api.cognitive.microsoft.com/sts/v1.0/issueToken],引用版本1.0,另一个端点是[api / speechtotext / v2.0 / transcriptions],引用版本2.0 。如何在Azure门户中为后者创建语音转文本服务?
[每当我在不同地区创建服务时,它总是创建语音到文本v1.0。
任何提示?
PS:我的Visual Studio Enterprise帐户具有每月津贴,我正在创建订阅(s0)(付费)服务,而不是免费(试用)(f0)服务。
谢谢,厄兹古尔
理解您的困惑,因为MS文档对此含糊不清。根据我的研究,让我对其进行以下澄清:存在两种语音到文本服务,v1
和v2
。
v1在创建时可以在认知服务结构下找到:
基于Speech-to-text REST API document中的语句:
使用语音转文本REST API之前,请了解:
如果您的应用要求发送更长的音频,考虑使用Speech SDK或基于文件的REST API,例如批处理转录。
因此v1对文件格式或音频大小有一些限制。如果您还有更多要求,请导航到Zoom Media托管的v2 api批处理转录。如果您从ZM阅读此document,则可以弄清楚。您可以在Azure市场中创建该Speech Api:
这是它的创建页面:
另外,您可以在上一页的底部查看API文档,它是V2 api document。
最后提示:
v1的端点,例如:https://eastus.api.cognitive.microsoft.com/sts/v1.0/issuetoken
v2的端点,例如:
希望我对此很清楚!