我有这个带标签的句子:
[x] moved to [y] in [z].
如何设置[x],[y]作为名词,[z]作为日期时间的注释?我提到了https://spacy.io/usage/linguistic-features#native-tokenizer-additions,但没有找到想要的东西,或者错过了它。
您可以使用令牌生成器特殊情况(https://spacy.io/usage/linguistic-features#special-cases)设置POS:
orth = "[z]"
nlp.tokenizer.add_special_case(orth, [{"ORTH": orth, "TAG": "NUM"}])
(坦白地说,拥有令牌化程序设置标签很奇怪,但是此功能现在已经存在。)