Microsoft语音识别结果的格式(挪威语)

问题描述 投票:0回答:1

在我们正在进行的使用各种语音到文本供应商转录视频材料的实验中,Microsoft似乎是实际单词识别的有力竞争者。对于英语材料,格式/标点符号也很不错,但是对于挪威语材料(与我们最相关),几乎没有任何格式/标点符号。我们正在使用C#API SpeechRecognizer,将config.SpeechRecognitionLanguage设置为“ nb-NO”,将config.OutputFormat设置为OutputFormat.Detailed,并使用config.RequestWordLevelTimestamps()。我们可以做些什么来改善结果的格式吗?

此外,当检索带有时间戳的单个单词时(这是我们的要求之一),即使使用英语材料也没有格式。检索单个单词时,可以设置一些选项来保持格式/标点吗?

最好的问候,Gunnar

speech-recognition microsoft-cognitive
1个回答
0
投票

Microsoft语音格式化对nb-NO结果的支持目前确实非常基础。根据要求,显示结果具有基本数字格式和显式标点符号。 Microsoft语音正在积极致力于改善自动标点和大写字母以改善结果。关于时间戳,当前它不为显示级别生成时间戳。将来可能会支持。

© www.soinside.com 2019 - 2024. All rights reserved.