Natural Language Toolkit是一个用于计算语言学的Python库。
如何使用spacy / nltk生成bi / tri-gram
输入文字总是菜名列表,其中有1~3个形容词和名词输入泰国冰茶辣鸡肉甜辣椒猪肉泰国鸡肉咖喱输出:泰国茶,冰茶......
我需要网页抓取一个网页,找到五个最常见的名字。预期的输出应该像[('Anna Pavlovna',7),('王子',7),('皇后',3),('...
我试图让我的代码刮到http://www.pythonscraping.com/pages/warandpeace.html,然后打印出10个最常见的英文单词。但是,我发现的代码最常见...
目前,我将创建一个基于机器学习的代码,自动映射类别。我之前会做自然语言处理。有几个单词列表。发送= ...
我希望有人能够纠正我对VADER如何评分文字的理解。我在这里读过这个过程的解释,但是我无法将测试句的复合分数与Vader的输出相匹配......
我是Python新手,我正在尝试自学语言处理。 python中的NLTK有一个名为FreqDist的函数,它给出了文本中单词的频率,但由于某种原因,它不起作用......
是否可以在NLTK中使用Stanford Parser? (我不是在谈论斯坦福POS。)
我有一个如下所示的熊猫数据框:类型关键字---------动物[鸽子,鸟,浣熊,狗,猫]宠物[狗,猫,仓鼠]害虫[大鼠,。 ..
使用DataFrame.apply()生成值时返回Synset('')包装器
当我通过DataFrame.apply()传递一个函数时,我得到的值包含在我假设的对象类型中。我现在看到两个应用程序的这个错误:一个使用NLTK的Wordnet库(返回...
如何从python中的字符串arraylist中删除停用词?
我想从名为arrayList1的arraylist中删除停用词,该列表存储在数据变量中。我尝试下面的方法,但它不起作用。请帮我查一下以下代码......
Cyclic Imports用于修复pylint中的R0401
Pylint抱怨使用R0401错误代码循环导入NLTK包的特定文件,例如: nltk / nltk / ccg / lexicon.py:1:[R0401(循环导入),]循环导入(nltk - > nltk.internals)...
我正在使用nltk来查找句子中每个单词的词性。它返回的缩写,我既不能完全直觉,也找不到好的文档。正在运行:import nltk sample =“...
我一直试图安装nltk,但每次我尝试这样做,我都得到了同样的错误:Errno 10060连接尝试失败,因为连接方没有正确响应...
我试图在python 2.7导入nltk包中导入nltk stopwords = nltk.corpus.stopwords.words('english')print(stopwords [:10])运行这个给出了以下错误:LookupError:...
具有相同单词root / stem的单词可以被视为同义词吗?
基本上,具有相同词根/词干的两个单词是否可以被视为同义词,特别是在搜索引擎/信息检索上下文中使用时?
python3 nltk,WordNetLemmatizer发生错误[重复]
我查看了这本书并制作了书中的代码。顺便说一句,我有以下错误。我该怎么办?从nltk.stem导入PorterStemmer,W ordNetLemmatizer发送='笑你...
import spacy,en_core_web_sm nlp = en_core_web_sm.load()doc = nlp(u“我将去购物中心”)chk_set = set(['VERB'])print chk_set.issubset(t.pos_ for t in doc)代码如果POS = ...则返回True
我刚刚开始使用NLTK;我找到了标记功能,我已经在线查找,但没有找到答案。我为什么要标记一个字符串?有什么好处?标记甚至做什么?
好的,我简化了我的问题:我有一个(文件)列表,其中包含一些(句子)列表作为str。比如a = [['First1 from first doc!','Sent2 from first doc。'],['Sent1 from 2nd doc。','Sent2 from ...