我用沃森助手给客户的邮件分类。
我读了一个很好的答案有关创建意图Best practices for creating intents/entities with IBM Conversation Service的最佳实践。它给了我一些想法如何提高的结果。
但是,我有一个关于它们添加到沃森之前清洁例子问题。
我必须删除所有号码,姓名,日期等?我必须删除该短语,如“你好,谢谢你,在等着你反应... ..”?
例如,最初的电子邮件是:
您好,我将搬到另一个城市,并在4月21日之后,我的住址将发生变化。我的新住址将是伦敦,美国广播公司街123,应用程序。 34.你能在我的PROFIL更新呢?感谢您提前。此致,马克
在“干净”的邮件:
我将搬到另一个城市,我的地址将发生变化。我的新地址是
我必须删除所有不必要的信息,或者最好是最初的短语添加到沃森?
你知道什么是沃森的算法在使用助理做出分类(意图)?
感谢您事先的任何回应。
你不应该火车PII信息。它增加了什么有价值的模型。它还创建一个风险,如果有一个数据相关的审计。例如GDPR。
查找邮件意图和火车上的精髓。
你举的例子是,他们要更新他们的个人资料。
要知道,WA的目的不是要分类的电子邮件。所以,你可能需要设计一种机制来得分每个句子,或者处理多个意图在一封电子邮件。
另一种选择是屈臣氏NLC,这是我见过用作邮件分类。
你也应该尽量减少PII存储在沃森助手,虽然是PII兼容,并支持GDPR。