用于构建POS标签的命令句数据集

问题描述 投票:1回答:1

我正在尝试自行为命令式语句构建POS标记器。

到目前为止,我已经尝试使用nltk在python中使用以下代码进行POS标记:

import nltk
from nltk import pos_tag, word_tokenize
text = word_tokenize("open app and play movie")
print(nltk.pos_tag(text))

输出:

[('open', 'JJ'), ('app', 'NN'), ('and', 'CC'), ('play', 'VB'), ('movie', 'NN')]

在“ open”的情况下,错误地将动词归为形容词。我进行了很多搜索,并找到了许多解决方案。其中之一是构建自己的POS标记器。

我所有的句子都是命令式句子。我想在命令式句子上构建POS标记器。如果有任何命令式句子数据集可用,这将有助于训练我的POS标记器正确分类。

python nltk pos-tagger
1个回答
© www.soinside.com 2019 - 2024. All rights reserved.