我正在寻找用于技术产品审查的荷兰语标记器

问题描述 投票:1回答:1

我正在尝试找出解决荷兰语NLP问题的更好的文本清除方法。我使用pos标签使用荷兰语版本,使用nltk删除停用词。但是我没有得到期望的结果。

nlp tokenize sentiment-analysis
1个回答
0
投票

您是否尝试过用这种方法进行荷兰语练习?

from nltk.util import ngrams
from nltk.corpus import alpino
print(alpino.words())
quadgrams=ngrams(alpino.words(),4)
for i in quadgrams:
    print(i)

© www.soinside.com 2019 - 2024. All rights reserved.