当我在 Google Speech to text api 中启用扬声器分类时,扬声器标签是什么?

问题描述 投票:0回答:1

当我在谷歌语音到文本 API 中启用说话者分类时,我会获得每个单词的说话者标签。这些标签是什么?他们的意思是什么?当我给说话者计数 2 时,我有时会得到标签 0 和 2,有时会得到 0 和 1,有时我也会得到 0,1,2,尽管我的说话者计数是 2。那么这些标签意味着什么?

google-cloud-speech
1个回答
0
投票

您已将发言者计数设置为 2,并且您会看到发言者标签 {0, 1, 2}。

Speaker 0 是整个脚本,不是二值化输出的一部分。您可以丢弃扬声器 0,因为它只是重复整个脚本并且不提供有关二值化的唯一信息。

当发言者人数为 2 时,发言者 1 和 2 将包含整个脚本。我希望这有帮助。

© www.soinside.com 2019 - 2024. All rights reserved.