Virtual Assistant-> LUIS,QnA,调度程序最佳实践

问题描述 投票:0回答:1

我对使用LUIS,QnA Maker,尤其是分派器所面临的某些问题,对某些“最佳实践”有疑问,

1)如果分派器中的发音超过15k,是否有最佳实践?这看起来似乎是LUIS应用程序的局限性,但从长远来看,该模型的可扩展性将令人怀疑。

2)Bing BLU的拼写检查会更改名称和姓氏,例如,如何避免这种情况?我猜我们在谈论ChatBots时必须进行Bing拼写检查,因为错别字总是在门后,但是使用它来命名很危险。

3)不支持开箱即用的交叉验证,您应该使用自定义代码将数据拆分为折叠(并不困难),使用命令行在k-1 / k折叠上训练并发布模型,然后将k折语音一一发送给API。仅通过UI https://cognitive.uservoice.com/forums/551524-language-understanding-luis/suggestions/20082157-add-api-to-batch-test-model支持批量上传,并且仅限于1,000个发音的测试集。如果我们采用一对一的方法,则每1k交易我们需要支付$ 1,50 https://azure.microsoft.com/de-de/pricing/details/cognitive-services/language-understanding-intelligent-services/,这意味着要获得5折的交叉验证指标,我们可以为单项实验支付约20 $我们当前的数据,如果我们添加更多数据,则更多。

4)模型是一个黑匣子,如果需要,我们无法使用自定义功能。

我对使用LUIS,QnA Maker面临的某些问题,特别是对于分派器,有一些关于“最佳实践”的问题:1)如果有更多的最佳实践,有没有最佳实践……]]] >

我将尽我所能,尽最大可能解决您的问题:

1)根据LUIS文档,

enter image description here

因此,您不能超过限制。在Dispatch应用程序的情况下,如果总话语量超过15k,则分派将降低对话语的采样率,以将其保持在15k以下

。 CLI有一个可选参数(--doAutoActiveLearning),用于进行自动主动学习,该学习将智能地进行采样(删除无关的说话)。

-doAutoActiveLearning :(可选)默认为false。 LUIS对训练集大小的限制是15000。当LUIS应用具有更多的训练话语时,Dispatch的自动主动学习过程可以智能地对这些话语进行采样。

2)Bing拼写检查可帮助用户在LUIS预测发音的分数和实体之前纠正发音中的拼写错误的单词。但是,如果要避免使用Bing Spell Check API服务,则您将需要添加正确和不正确的拼写,可以通过两种方式完成:

  • 标签示例话语具有所有不同的拼写,以便LUIS可以学习正确的拼写和错别字。与使用拼写检查器相比,此选项需要更多的标签工作。
  • 创建具有所有单词变体的短语列表。使用此解决方案,您无需在示例话语中标记单词变体。

    3)根据电流documentation,每次测试最多允许1000声。数据集是JSON格式的文件,最多包含1,000个带标签的非重复性话语。一个应用程序最多可以测试10个数据集。 如果需要测试更多,请删除一个数据集,然后添加一个新数据集。

  • 我建议您将其作为功能请求报告给feedback forum

    希望这会有所帮助。

azure nlp botframework luis qnamaker
1个回答
0
投票

我将尽我所能,尽最大可能解决您的问题:

© www.soinside.com 2019 - 2024. All rights reserved.