nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

POS后使用Wordnet将熊猫列合法化

我有一个带有文本的熊猫列df_travail [line_text]。我想对本专栏的每个词进行词法化。首先,我将文本小写:df_travail ['lowercase'] = df_travail ['line_text']。str.lower()...

回答 1 投票 0

将K均值聚类距离度量更改为堪培拉距离或python上的任何其他距离度量

如何将k均值聚类的距离度量更改为堪培拉距离或任何其他距离度量?根据我的理解,sklearn仅支持欧氏距离,而nltk似乎不支持...

回答 1 投票 0

获得nltk k的惯性意味着使用余弦相似度进行聚类

我已经使用nltk进行k个均值聚类,因为我想更改距离度量。 nltk k表示的惯性是否类似于sklearn?似乎无法在他们的文档中或在线上找到。....

回答 1 投票 0

Word Cloud python库在每个单词的末尾显示一个撇号

我使用nltk.tokenize对txt文件进行标记化,并生成了一个新文件,我们将其称为“ File_B”。然后我运行:从wordcloud导入WordCloud导入matplotlib.pyplot as plt text = open('File_B')....

回答 1 投票 0

Python NLTK:SyntaxError:文件中的非ASCII字符'\ xc3'(情感分析-NLP)

我正在与NLTK一起做情感分析作业。我正在使用Python 2.7。 NLTK 3.0和NumPy1.9.1版本。这是代码:__author__ ='karan'import nltk import re import ...

回答 1 投票 56

我无法导入py3中的file.txt

我正在尝试在py3上编写程序。我已经将2个原始文本与“ programm.py”保存在同一目录中,但是该程序找不到这些文本。我正在使用emacs,我写道:从__future__ import ...

回答 2 投票 -1

如何使用nltk(python)获得K均值簇的各个质心

我已经使用nltk执行k个均值聚类,因为我想将距离度量更改为余弦距离。但是,如何获得所有群集的质心? kclusterer = ...

回答 1 投票 0

我无法用Python3朗读句子

我正在使用python3,我正在训练用双字表达一个句子,但是解释器给了我一个我听不懂的问题。 〜$ python3 Python 3.6.9(默认值,2019年11月7日,10:44:02)在Linux上的[GCC 8.3.0] ...

回答 1 投票 0

我有一个数据集,我想在该数据集上使用NLP进行短语提取,但我无法这样做?

[如何使用具有句子Sentence1形式的一组句子和相应标签的数据集从句子中提取短语:我想玩板球Label1:播放板球Sentence2 ......

回答 1 投票 0

查找句子是肯定的,中性的还是否定的?

我想创建一个脚本来查找句子是肯定的,中性的还是否定的。我在网上搜索时发现,通过一篇中篇文章,可以使用NLTK库完成此操作。所以,我...

回答 1 投票 1

确定句子是肯定的,中立的还是否定的?

我想创建一个脚本来查找句子是肯定的,中性的还是否定的。我在网上搜索时发现,通过一篇中篇文章,可以使用NLTK库完成此操作。所以,我...

回答 1 投票 1

此TensorFlow二进制文件已通过Intel(R)MKL-DNN优化,以在性能要求严格的情况下使用以下CPU指令

我正在尝试在Ubuntu上安装tensorflow,并且我收到此消息:(base)k @ k-1005:〜/ Documents / ClassificationTexte / src $ python tester.py使用TensorFlow后端。跑步:1 1.1。培训...

回答 1 投票 0


使用python3和nltk从模块调用函数的问题

摘自该书:使用Python进行自然语言处理,第16页。 60.我创建了一个带有一些功能的模块(在EMACS中),但是当我使用Python3运行它们时,它们给我带来了问题。 Python 3.6.9(默认值,11月...

回答 1 投票 1

如何从以NLTK标记的结果中获得前三个单词

我正在尝试将结果中的前三个字标记为NLTK。按单词使用的频率排序。导入nltk nltk.download('punkt')nltk.download('averaged_perceptron_tagger')...

回答 2 投票 0

不同地块重叠

我正在使用matplotlib和nltk绘制不同作者的频率分布,但似乎在该图中绘制了两个图。如何通过为作者名频率创建另一个单独的图来解决此问题...

回答 1 投票 0

“ TclError:没有显示名称,没有$ DISPLAY环境变量” nltk中出现错误

news =“美国总统唐纳德·特朗普周二表示,他将与中国国家主席习近平举行签字仪式,以签署本月达成的美中贸易协定的第一阶段。” ...

回答 1 投票 0

将句子转换为文档上下文向量的Keras LSTM

我阅读了以下博客文章,并尝试通过Keras实现它:https://andriymulyar.com/blog/bert-document-classification现在,我对Keras相当陌生,我不知道如何使用“ seq2seq .. 。

回答 1 投票 2

使用python熊猫和替换函数进行字符串操作

我正在尝试编写代码,以检查csv文件中的句子并搜索第二个csv文件中给出的单词并将其替换,我的代码如下所示,它不返回任何错误,但.. 。

回答 3 投票 1

[python 3求解数据框

试图从包含阿拉伯语句子的csv文件中删除停用词,但我不确定我得到了很多错误,我的代码print(tokenized_docs_no_punctuation)stop = set(stopwords.words('...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.