nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

Python NLTK从CSV准备数据以进行标记化

我是Python和NLTK的新手。从CSV导入文本后,我正在尝试使用NLTK在Python中准备用于标记化的文本。文件中只有一栏包含自由文本。我想隔离...

回答 1 投票 0

NLP:如何结合词干和标记?

我正在尝试编写代码,该代码传递经过标记化的文本,并过滤掉停用词,然后阻止并标记它。但是,我不确定应该以什么顺序进行茎和标记。这个...

回答 2 投票 0

比较句子列表和单词列表,如果存在单词,则返回完整的句子

从句子列表和单词列表中,如果存在单词,如何返回完整句子列表。请提出建议。以下是示例列表。 listwords = ['people','Covid-19','...

回答 1 投票 -1

将NLTK树转换成字典数组

我想将下面的nltk树转换成字典数组:(SI / PRP'll / MD有/ VB(数量1 / CD)(餐披萨/ NN)与/ IN(成分培根/ NN)和/ CC(数量2 / CD)...

回答 1 投票 0

如何在numpy.ndarray中标记?

我有以下ndarray:X_train:[[,]] array([['Boots new','Boots 46 size new'],['iPhone 7 plus 128GB Red','\ xa0 / \ n / \ n此价格仅适用于Instagram ...

回答 1 投票 0

gematria函数-根据数值处理文本

我正在尝试根据字典来处理文本,即圣经,以提取其单词字母的数值:def gematria(book):dict = {'a':1,'b': 2,“ c”:...

回答 1 投票 1

是否可以在网络上的python中集成机器学习算法

[我为python中的聊天机器人设计了一种机器学习算法,该算法使用了不同的库sklearn,NLTK等。该算法从用户处获取输入并根据查询用户进行回复...

回答 2 投票 -1

将字符串分割成句子,并保留换行符

假设我有一个字符串,例如:s =“ Hello world.Hello world。\ n \ n这是foo。\ n再见了。”我目前正在使用从nltk import tokenize的句子将此字符串分成句子...

回答 2 投票 0

找不到资源点。但是,它已下载并安装

我在数据框中有以下几列。未命名:0,标题,出版物,作者,年份,月份,title.1,内容,len_article,gensim_summary,split_words,first_100_words我正在尝试运行此...

回答 1 投票 0

如何理解简历中节名的样式?

Python 2.6最近,我正在使用简历进行一些文本挖掘。目的是根据简历的标题和内容将简历分为几部分,然后将其分类为必需的...

回答 1 投票 3

为什么nltk单词计数与使用Regex进行单词计数不同?

问题我们有来自txt文件(https://www.gutenberg.org/files/2701/old/moby10b.txt)的相同文本的两个“版本”:raw_text = f.read()nltk_text = nltk。文本(nltk.word_tokenize(raw_text))什么...

回答 1 投票 0

Python Newspaper函数在循环期间不读取文章URL?

抱歉,如果这是一个愚蠢的问题-我是Python新手,对excel VBA更熟悉。我试图让Python遍历excel文档中包含的多个文章URL并创建...

回答 1 投票 0

我无法通过情感分析来提高考试的准确性

我不确定这是否是正确的位置,但是我的测试准确度始终约为.40,而我的训练设置准确度可以达到1.0。我正在尝试对特朗普上的推文进行情感分析,我有...

回答 1 投票 0

spacy训练数据中的头是什么意思?

我正在尝试根据自己的数据训练模型,并且正在使用Spacy库。但是我对代码示例中的“ #token head index”感到困惑。头在这里到底是什么意思? #训练数据:文本,...

回答 1 投票 0

TypeError:lemmatize()缺少1个必需的位置参数:'word

我在csv文件中的每一行都有一个数组,如下所示:[['thxx'],['too','late','now','dumbass'],['you',''' ,'re','so','dumb','?','?'],['thxxx'],['i',''','d','be','fucked']]当...

回答 1 投票 1

为什么用户站点程序包在virtualenv中不可见?

[在安装nltk模块时,这些先决条件之一是在称为dl4cv的venv中使用commande pip install --user -U nltk命令,但出现错误:(dl4cv)hdafa @ hdafa-HP-ProBook-450-G5: 〜$ pip ...

回答 1 投票 0

即使可以在Python控制台中导入nltk也无法在Jupyter中导入

我安装了nltk,并且似乎已成功安装。但是,当我尝试导入它时,它说没有名为nltk的模块。但是,当我尝试重新安装它时,它说要求已经满足。怎么可能...

回答 1 投票 1

即使正确安装也找不到Nltk

我安装了nltk,并且似乎已成功安装。但是,当我尝试导入它时,它说没有名为nltk的模块。但是,当我尝试重新安装它时,它说要求已经满足。怎么可能...

回答 1 投票 0

计算文本中字符串列表的出现次数

我想用Python计算文本中列表元素的出现次数。我知道我可以使用.count(),但是我已经读到这会影响性能。此外,列表中的元素可以包含多个单词。 ...

回答 1 投票 0

情感分析无法显示正确的结果

def情感(极性):如果blob.sentiment.polarity <0:print(“ Negative”)elif blob.sentiment.polarity> 0:print(“ Positive”)else:print(“ Neutral”)上面是定义。 ..

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.