这个问题在这里已有答案:
我想使用正则表达式识别笑/滑稽的单词,例如:ahahah
或hahaha
。所以想法是识别重复ah
或ha
或lol
等。此外,我还想识别ah ah ah
。我查看了一个similar question,但它没有包含n-gram之间的空格(例如ah ah
)。我能够定义:
'(?:ha)+|(?:ah)+|(?:lol)+'
这个表达式确实有效,但它提供了许多误报。例如,它匹配happen
或having
或hax
。我怎样才能识别重复的ah
或ha
定义的单词。此外,我可以使用相同的表达式来捕捉ha ha ha
吗?