我正在尝试找出解决荷兰语NLP问题的更好的文本清除方法。我使用pos标签使用荷兰语版本,使用nltk删除停用词。但是我没有得到期望的结果。
您是否尝试过用这种方法进行荷兰语练习?
from nltk.util import ngrams from nltk.corpus import alpino print(alpino.words()) quadgrams=ngrams(alpino.words(),4) for i in quadgrams: print(i)