Virtual Assistant-> LUIS，QnA，调度程序最佳实践

我对使用LUIS，QnA Maker，尤其是分派器所面临的某些问题，对某些“最佳实践”有疑问，

1）如果分派器中的发音超过15k，是否有最佳实践？这看起来似乎是LUIS应用程序的局限性，但从长远来看，该模型的可扩展性将令人怀疑。

2）Bing BLU的拼写检查会更改名称和姓氏，例如，如何避免这种情况？我猜我们在谈论ChatBots时必须进行Bing拼写检查，因为错别字总是在门后，但是使用它来命名很危险。

3）不支持开箱即用的交叉验证，您应该使用自定义代码将数据拆分为折叠（并不困难），使用命令行在k-1 / k折叠上训练并发布模型，然后将k折语音一一发送给API。仅通过UI https://cognitive.uservoice.com/forums/551524-language-understanding-luis/suggestions/20082157-add-api-to-batch-test-model支持批量上传，并且仅限于1,000个发音的测试集。如果我们采用一对一的方法，则每1k交易我们需要支付$ 1,50 https://azure.microsoft.com/de-de/pricing/details/cognitive-services/language-understanding-intelligent-services/，这意味着要获得5折的交叉验证指标，我们可以为单项实验支付约20 $我们当前的数据，如果我们添加更多数据，则更多。

4）模型是一个黑匣子，如果需要，我们无法使用自定义功能。

我对使用LUIS，QnA Maker面临的某些问题，特别是对于分派器，有一些关于“最佳实践”的问题：1）如果有更多的最佳实践，有没有最佳实践……]]] >

我将尽我所能，尽最大可能解决您的问题：

1）根据LUIS文档，

因此，您不能超过限制。在Dispatch应用程序的情况下，如果总话语量超过15k，则分派将降低对话语的采样率，以将其保持在15k以下

。 CLI有一个可选参数（--doAutoActiveLearning），用于进行自动主动学习，该学习将智能地进行采样（删除无关的说话）。

-doAutoActiveLearning ：（可选）默认为false。 LUIS对训练集大小的限制是15000。当LUIS应用具有更多的训练话语时，Dispatch的自动主动学习过程可以智能地对这些话语进行采样。

2）Bing拼写检查可帮助用户在LUIS预测发音的分数和实体之前纠正发音中的拼写错误的单词。但是，如果要避免使用Bing Spell Check API服务，则您将需要添加正确和不正确的拼写，可以通过两种方式完成：

标签示例话语具有所有不同的拼写，以便LUIS可以学习正确的拼写和错别字。与使用拼写检查器相比，此选项需要更多的标签工作。
创建具有所有单词变体的短语列表。使用此解决方案，您无需在示例话语中标记单词变体。
3）根据电流documentation，每次测试最多允许1000声。数据集是JSON格式的文件，最多包含1,000个带标签的非重复性话语。一个应用程序最多可以测试10个数据集。 如果需要测试更多，请删除一个数据集，然后添加一个新数据集。

希望这会有所帮助。