如何在Spacy中标记不包含特定符号的单词?

问题描述 投票:0回答:1

我正在尝试使用正则表达式在 Spacy 中标记一个单词,但我想添加一个条件:它内部任何位置都不能包含符号“/”。我的代码如下所示:

[{'lower': {"regex": "^.*(word).*?"}}]

我尝试使用 ^ 来排除它,但它不起作用。

所以例子:

  1. “subwordw”标记为:“subword”
  2. “subword/w”没有标记任何内容
python nlp pattern-matching spacy
1个回答
0
投票

试试这个:

{'lower': {'REGEX': "^([^\/]*word[^\/]*)$"}}

© www.soinside.com 2019 - 2024. All rights reserved.