为部落语言POS标记创建语料库

问题描述 投票:0回答:1

我正在使用NLTK从文本字符串中提取名词,并且每个单词在(ibaloi)语言中已经有了POS标签,后来用于创建语法:

sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))

英语没有问题。有没有办法使它在部落(ibaloi)语言中工作?

(我是自然语言过程的新手,学习一些很棒的教程。)

python nlp nltk corpus
1个回答
0
投票

您可能想要参考this类似的问题,其中OP还有一个单词列表,其中包含Excel文件中的单词和词性(名词,动词等),用于不在NLTK中的语言。

© www.soinside.com 2019 - 2024. All rights reserved.