准备训练例子沃森助手

问题描述 投票:0回答:1

我用沃森助手给客户的邮件分类。

我读了一个很好的答案有关创建意图Best practices for creating intents/entities with IBM Conversation Service的最佳实践。它给了我一些想法如何提高的结果。

但是,我有一个关于它们添加到沃森之前清洁例子问题。

我必须删除所有号码,姓名,日期等?我必须删除该短语,如“你好,谢谢你,在等着你反应... ..”?

例如,最初的电子邮件是:

您好,我将搬到另一个城市,并在4月21日之后,我的住址将发生变化。我的新住址将是伦敦,美国广播公司街123,应用程序。 34.你能在我的PROFIL更新呢?感谢您提前。此致,马克

在“干净”的邮件:

我将搬到另一个城市,我的地址将发生变化。我的新地址是

我必须删除所有不必要的信息,或者最好是最初的短语添加到沃森?

你知道什么是沃森的算法在使用助理做出分类(意图)?

感谢您事先的任何回应。

machine-learning ibm-cloud watson-conversation
1个回答
1
投票

你不应该火车PII信息。它增加了什么有价值的模型。它还创建一个风险,如果有一个数据相关的审计。例如GDPR。

查找邮件意图和火车上的精髓。

你举的例子是,他们要更新他们的个人资料。


要知道,WA的目的不是要分类的电子邮件。所以,你可能需要设计一种机制来得分每个句子,或者处理多个意图在一封电子邮件。

另一种选择是屈臣氏NLC,这是我见过用作邮件分类。


你也应该尽量减少PII存储在沃森助手,虽然是PII兼容,并支持GDPR。

© www.soinside.com 2019 - 2024. All rights reserved.