pos-tagger 相关问题

词性标注器或POS标记器是算法的具体实现,其根据一组描述性标签(例如将词语识别为名词,动词)将离散词语以及隐藏词性相关联。 ,形容词,副词等。它通常遵循基于机器学习(ML)技术的方法。

如何为每个词性标记创建pandas数据框列?

我有一个数据集,由标记化的,POS标记的短语组成,作为数据帧的一列:当前数据帧我想在数据框中创建一个新列,仅包含专有名词...

回答 1 投票 0

使用Spacy en_core_web_lg模型,POS标记不一致

PROPN的POS标记使用en_core_web_lg模型无法以预期方式工作。 POS标记使用_md模型可以更加可预测地工作。鉴于(形成不佳)的句子:“CK7,CK-20,GATA 3,......

回答 1 投票 1

从列表中的元组中提取带有NN标记的单词

我试图在每个元组中提取具有'NN'标记的第0个元素。只想根据标签提取单词。例如。每一行:train ['Tag'] = [('unclear','JJ'),('不完整','JJ'),('...

回答 3 投票 -2

如何在python的单独列中排列的数据框中插入pos标签?

我有POS使用TextBlob标记我的输入文本并将其导出到文本文件中。它给了我三个信息,如POS,Parse Chunker和Deep Parsing。此标记的输出采用以下格式:...

回答 1 投票 0

python3 nltk,WordNetLemmatizer发生错误[重复]

我查看了这本书并制作了书中的代码。顺便说一句,我有以下错误。我该怎么办?从nltk.stem导入PorterStemmer,W ordNetLemmatizer发送='笑你...

回答 1 投票 1

使用NLTK创建和利用标记的语料库

我正在尝试在马达加斯加(我的母语)创建一个标记语料库。我按照Python文本处理和自然语言处理文档中的说明和https://www.nltk ....

回答 1 投票 0

NLTK Chunk Parser:如何逃避特殊字符

所以我试图从文本中提取一些信息,我正在使用NLTK分块。这是我的投入股票显示67%的涨幅,去年跌幅为12%我想抓住67%的涨幅和12%的跌幅...

回答 2 投票 0

在python中的NLTK中的POS标记错误的zip文件错误

我是python和NLTK的新手。我想在这里做单词标记化和POS标记。我在我的Ubuntu 14.04中安装了Nltk 3.0,默认python 2.7.6。首先我试着做一个简单的标记...

回答 1 投票 0

如何只从文件中检索那些有名词标签的单词?

我有一个程序只从文件中提取那些pos标签存在pos-tags变量的单词。我的程序没有给出任何错误,但它也没有显示任何错误。它只执行。这里 ...

回答 1 投票 1

如何仅从文件中检索带有名词标签的单词?

我只需要从pos标签为'NN'或'NN'或'NNS'或'NNPS'的文件中检索那些单词。我的样本输入是:[[For,IN',',,,','We,PRP','the,DT','divine,NN','cause,VBD','apostle,NN'.. 。

回答 3 投票 -1

AttributeError:'list'对象没有属性'isdigit'。有效地指定句子列表中每个单词的POS?

假设我将句子列表(在大型语料库中)列为标记化单词的集合。样本格式如下:tokenized_raw_data的格式如下:[['arxiv',':',...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.