用于构建POS标签的命令句数据集

问题描述投票：1回答：1

我正在尝试自行为命令式语句构建POS标记器。

到目前为止，我已经尝试使用nltk在python中使用以下代码进行POS标记：

import nltk
from nltk import pos_tag, word_tokenize
text = word_tokenize("open app and play movie")
print(nltk.pos_tag(text))

输出：

[('open', 'JJ'), ('app', 'NN'), ('and', 'CC'), ('play', 'VB'), ('movie', 'NN')]

在“ open”的情况下，错误地将动词归为形容词。我进行了很多搜索，并找到了许多解决方案。其中之一是构建自己的POS标记器。

我所有的句子都是命令式句子。我想在命令式句子上构建POS标记器。如果有任何命令式句子数据集可用，这将有助于训练我的POS标记器正确分类。

python

nltk

pos-tagger

1个回答