我正在使用NLTK从文本字符串中提取名词,并且每个单词在(ibaloi)语言中已经有了POS标签,后来用于创建语法:
sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))
英语没有问题。有没有办法使它在部落(ibaloi)语言中工作?
(我是自然语言过程的新手,学习一些很棒的教程。)
您可能想要参考this类似的问题,其中OP还有一个单词列表,其中包含Excel文件中的单词和词性(名词,动词等),用于不在NLTK中的语言。