nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

如何为n-gram训练朴素贝叶斯分类器(movie_reviews)

下面是针对unigram模型的movie_reviews数据集上的Naive Bayes分类器训练代码。我想通过考虑bigram,trigram模型来训练和分析它的性能。我们怎么做呢...

回答 1 投票 3

如何使用python(nltk)匹配段落中的关键字

关键词:关键词= {u'secondary':[u'sales growth',u'next generation store',u'Steps Down',u'Profit warning',u'Store of the Future',u'groceries']}段落:段落=“”“休斯顿 - ......

回答 2 投票 1

如何使用NLTK BigramAssocMeasures.ch_sq

我有单词列表,我想通过考虑它们的共现来计算两个单词的相关性。从一篇论文中我发现它可以用Pearsson卡方检验来计算。我也发现......

回答 1 投票 1

nltk-all集合上的NLTK错误:`info.packages TypeError:'NoneType'对象不可迭代

我在IPython / Jupyter笔记本中学习NLTK,Python 3 *昨天我可以运行nltk.download_shell(),并使用l命令列出所有包。我输入Enter来浏览整个列表...

回答 1 投票 0

类型错误:不可用类型:使用Python字符串集时的列表

我知道在这个问题上有几个非常相似的答案,但是没有一个真正回答我的问题。我正试图从列表中删除一系列停用词和标点符号...

回答 1 投票 2

如何用python将文本拆分为子句?

我想将文本分成子句。我怎样才能做到这一点?例如:text =“嗨,这是一个苹果。嗨,那是菠萝。”结果应该是:['嗨,','这是一个苹果。','嗨,','那是......

回答 5 投票 1

将一个段落标记为句子,然后将其转换为NLTK中的单词

我试图将整个段落输入到我的文字处理器中,先将其分成句子然后再分成单词。我尝试了以下代码,但它不起作用,#text是段落......

回答 2 投票 26

Chunk.draw()无法在python IDLE中工作

我无法在Python IDLE中绘制分块数据,我在Python cmd中成功打印它,我正在使用python 2.7并且我正在关注youtube上的教程,我找到了本教程,但我无法...

回答 1 投票 0

使用NLTK和MaltParser的依赖性解析器

我正在使用NLTK和Maltparser从自然语言的句子中提取依赖关系。我用这段代码做了一些使用斯坦福解析器的实验:sentence ='''我穿着睡衣射了一头大象''......

回答 1 投票 6

在pandas数据帧中预处理字符串数据

我有一个用户评论数据集。我已加载此数据集,现在我想预先处理用户评论(即删除停用词,标点符号,转换为小写,删除称呼等)之前...

回答 1 投票 1

NLTK图依赖图

我想用NLTK绘制这样的图形。但我不确定NLTK中的这样一个例子。任何人都可以展示一些示例NLTK代码来绘制这样的数字吗?谢谢。 HTTP:// ...

回答 1 投票 1

NLTK二元组格式/逐字阅读文件

我正在获取单词对,然后创建一个节点链接图。为了使我的节点链接图工作,我的对需要以这种格式出现graph =('one','two'),('two','three'),('three','one')I'我......

回答 1 投票 0

如何使用NLTK替换bigrams?

假设我有一个元组列表,top_n,在文本语料库中找到的前n个最常见的双字母组合:从nltk导入bigrams从nltk import导入nltk FreqDist bi_grams = bigrams(文本)#text是...

回答 2 投票 1

TfIDf矢量化器重量

嗨我有一个lemmatized文本格式如引理所示。我想获得每个单词的TfIdf得分这是我写的函数:将numpy作为np导入pandas导入numpy作为来自sklearn的pd ....

回答 1 投票 1

在Windows10 Pro上安装NLTK时出错

我想在Windows10 Pro 64位上安装NLTK。它给了我以下错误。需要Python版本-32,这在注册表中找不到。我在我的...中安装了python 3.5.0(32位)

回答 3 投票 0

在Python中结合CountVectorizer和ngrams

有一项任务是使用ngrams对男性和女性的名字进行分类。所以,有一个数据帧,如:name is_male Dorian 1 Jerzy 1 Deane 1 Doti 0 Betteann 0 Donella 0 The ...

回答 1 投票 1

在python中的NLTK中的POS标记错误的zip文件错误

我是python和NLTK的新手。我想在这里做单词标记化和POS标记。我在我的Ubuntu 14.04中安装了Nltk 3.0,默认python 2.7.6。首先我试着做一个简单的标记...

回答 1 投票 0

用于生成OCL的自然语言处理工具

请问我有一个名为(自动生成OCL约束)的大学项目,我的主管让我从这个自然语言处理工具列表中选择一个工具:Apache ......

回答 1 投票 -3

NLP从HTML到文本的预处理

我看到NLTK建议使用BeautifulSoup get_text()将HTML预处理为文本,以便进行后续的NLP分析。但它似乎并没有很好地发挥作用。在以下示例中,xyz和abc是......

回答 1 投票 2

NLTK情绪维达:订购结果

我刚刚在我的数据集上运行Vader情绪分析:从nltk.sentiment.vader导入SentimentIntensityAnalyzer从nltk import tokenize sid = SentimentIntensityAnalyzer()获取句子...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.