我想编写一个 Spacy 模式来匹配作者姓名。例如,“史密斯、约翰、琼斯、鲍勃”。但逗号可以是分号。我想我想要的图案是:
author_pattern = [
{"IS_ALPHA": True},
{"IS_ALPHA": True},
{"IS_PUNCT": True}]
除非我想说该模式可以重复一次或多次。我知道如何在模式中创建“一个或多个”元素,但不知道如何创建模式本身。
如果您想匹配一个或多个相同的模式,您可以使用“OP”键和“+”运算符。
请参阅此处的示例和官方文档: https://spacy.io/usage/rule-based-matching#example2