我正在尝试自行为命令式语句构建POS标记器。
到目前为止,我已经尝试使用nltk在python中使用以下代码进行POS标记:
import nltk
from nltk import pos_tag, word_tokenize
text = word_tokenize("open app and play movie")
print(nltk.pos_tag(text))
输出:
[('open', 'JJ'), ('app', 'NN'), ('and', 'CC'), ('play', 'VB'), ('movie', 'NN')]
在“ open”的情况下,错误地将动词归为形容词。我进行了很多搜索,并找到了许多解决方案。其中之一是构建自己的POS标记器。
我所有的句子都是命令式句子。我想在命令式句子上构建POS标记器。如果有任何命令式句子数据集可用,这将有助于训练我的POS标记器正确分类。