我正在为巴西葡萄牙语(pt_br)制作lemmatizer。我知道spacy为pt_pt提供了lemmatizer。该库也可以用于pt_br吗?否则pt_pt和pt_br之间会有很大的区别。
spaCy中的当前pt
版本实际上应该涵盖这两个版本。例如,请参见专门针对巴西货币符号的PR https://github.com/explosion/spaCy/pull/2790,以及专门考虑数字的两个拼写变体的两种版本的PR https://github.com/explosion/spaCy/pull/2307。