我正在查看 Speech-to-Text API,但有一些问题:
v1 和 v1p1 有什么区别?
Speech-to-Text v2 中的 chirp 模型是否支持从流输入转录音频?
版本控制表示 API 的不同版本或更新,较新的版本通常会引入改进、错误修复或新功能。此信息通常可在发行说明中找到。
API 版本提供 5 分钟限制的流媒体识别和 MP3 编码音频数据的转录。
v1p1beta1
在 Speech-to-Text v2
Chirp model