nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

我如何确定语料库中的哪些文本包含Python中的NLTK套件生成的错误?

我正在尝试使用Python进行一些基本的语料库分析。我收到以下错误消息:追溯(最近一次呼叫最近):文件“”,行2,在打印中(len(poems.words(...

回答 1 投票 0

除NLP的撇号外,如何从标点中删除字符串

我正在使用以下“最快”方式从字符串中删除标点符号:text = file_open.translate(str.maketrans(“”,“”,string.punctuation))但是,它删除了包括...的所有标点符号。 >

回答 1 投票 0

NLTK,Gensim,Scikit Learn的API调用

我计划将NLTK,Gensim和Scikit Learn用于一些NLP /文本挖掘。但是我将使用这些库来处理我的组织数据。问题是使用这些库时,它们是否进行API调用...

回答 1 投票 1

词组措辞

我正在编写一个机器人,而不是像用相同的方式来表达面向用户的交流,而是希望在保持原始意图的同时实现某种程度的语言更改。要做...

回答 1 投票 1

在NLTK中创建自己的主体的优势

我在Mysql表中有大量文本。我想进行一些统计分析,然后再使用NLTK工具包对我的文字进行一些NLP分析。我有两种选择:一次从我的...中提取所有文本...] >>

回答 1 投票 8

如何在NLTK CFG中匹配整数?

如果要定义一种语法,其中一个标记将与整数匹配,我如何使用nltk的字符串CFG来实现它?例如-S-> SK SO FK SK->'SELECT'SO->'\ d +'FK-> ...

回答 2 投票 2

Python-获取单词的所有形式

我想使用python获取所有形式的单词。例如,非洲将生成:“ Africa”,“ Africanism”,“ Africanist”,“ African”,理想情况下甚至以“ afro-”作为前缀。有图书馆吗?

回答 1 投票 0

NLTK数据下载在Anaconda环境中的MacOS上挂起

在全新的jupyter笔记本会话中运行以下命令,或直接从命令行运行以下命令:import nltk nltk.download()冻结MacOS登录会话,并要求重复登录而不是弹出...

回答 1 投票 0

快速/优化python中的N-gram实现

哪个ngram实现在python中最快?我试图剖析nltk和scott的zip(http://locallyoptimal.com/blog/2013/01/20/elegant-n-gram-generation-in-python/):从nltk.util导入...] >

回答 3 投票 11

在熊猫中执行nltk.stem.SnowballStemmer

我有一个四列DataFrame,其中有两列带标记的单词,这些单词已删除了停用词并转换为小写字母,现在正尝试阻止。我不确定是否apply()方法...

回答 1 投票 0

在大熊猫中发现二元动物

我有一个包含4列的DataFrame:'Headline','Body_ID','Stance','articleBody','Headline'和'articleBody包含已清理和标记化的单词。我想使用nltk查找二元语法,并具有...

回答 1 投票 0

有什么方法可以确定需要在python中使用NLP在句子或段落中放置逗号(,)和句号(。)的地方

例如,有一个句子,例如“我是XYZ,我想执行,我对此有疑问”。在上面的示例中,应该有1个逗号和1个句号,例如“我是XYZ,我想执行。我有一个怀疑。“ ...

回答 1 投票 -3

用于中性推文的TextBlob朴素贝叶斯分类器

我正在使用TextBlob做一个关于情感分析的小项目。我了解有2种方法可以检查tweet的情绪:Tweet极性:使用它我可以判断tweet是否为阳性,...

回答 1 投票 0

如何从使用nltk停用词的列表中的标记组成的子列表中删除停用词

我的列表如下:mylist = [['how','to','unlock','my','bajaj','finance','emi','card'],['how','到','解锁','我','卡片'],['如何','到','解锁','我','卡片','告诉','我','那个','什么,...

回答 1 投票 0

如何使用NLTK标记包含标点符号的单词

我有一个PlainTextCorpusReader,文字是从网络上抓取的招聘广告。我想剥夺使用NLTK的技能。但是由于读者将单词'C#'标记成单词,所以我的第一个障碍失败了。

回答 1 投票 0

如何以标记概率完成我的Unigram标记?

我正在创建一类Unigram Tagger。我相信我已经处于最后阶段,尽管我现在对如何计算标签的概率迷失了方向。到目前为止,我已经完成了对总数标签的计数,...

回答 1 投票 0

问题是将文本从第一人称转换为第二人称,而忽略引号中的文本”

我正在尝试将故事/句子/单词/等从第一人称语法转换为第二人称语法,但尝试不将引号“”或''中的文本转换为。这正在google colab中运行,python 3 ...

回答 1 投票 1


如何从python的串联字符串中提取有意义且频繁的单词?

我有一个串联字符串的列表,如下所示,我希望将其分成有意义和常见的词。我创建的代码也给了我各种不常用的单词。 con_words = ...

回答 1 投票 0

如何使用NLTK Wordnet获得更多同义词?

所以我正在使用此代码来获取同义词。从nltk.corpus导入wordnet def Get_Syn(text):xx = []句子1 = text.split(“”)对于句子1中的i:如果我不在停用词中:...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.