从客户演讲中提取字母数字字符串

问题描述 投票:1回答:1

我正在研究语音机器人。我很难提取pan卡号(hazwr2312g)。客户可以通过多种方式提供。例如,他们可以说我的pan id是(hazwr2312g)。

我已经创建了一个基于平移规则的正则表达式,它正常工作/ [a-z] {3} [abcfghljpte] [a-z] [0-9] {4} [a-z] / i并提取平移数。

但是,当客户通过语音给出pan号时,“g”通常在句子末尾用“ji”(hazwr2312 ji)代替。

各种话语:

1)我的锅号是hazwr2312 ji 2)hazwr2312 ji是我的锅号3)它是hazwr2312 ji 4)嗯嗯我的id是hazwr2312 ji

问题等等

我怎么解决这个问题?请指导我

问候见面

javascript node.js ibm-watson watson-conversation
1个回答
1
投票

您可以尝试使用regex或者您也可以选择splitindexOf等,如果您有特定类型的关键字,一直或常见。

© www.soinside.com 2019 - 2024. All rights reserved.