Natural Language Toolkit是一个用于计算语言学的Python库。
我正在尝试使用 NLTK 运行 N-Gram 语言建模代码,该代码取自 https://www.geeksforgeeks.org/n-gram-language-modelling-with-nltk/。但它抛出一个错误。 # 生成
加载停用词时出错:<urlopen error [Errno 110] Connection
下载 NLTK stopwords 时,出现以下错误 [nltk_data] 加载停用词时出错: 使用的代码是 进口
当使用 Rake 提取关键字时,该算法会创建其候选词组并根据它们的分数对它们进行排名,并返回至少具有一定分数的词组。 我怎样才能设置这个最小值...
我想为 nltk 提供的停用词列表添加一些词。我有一个 csv 文件,其中包含我想添加到列表中的停用词,但它不起作用。这是我试过的:
我正在处理包括地点和日期的书面文本(文章和书籍的段落)。我想从文本中提取包含地点和日期的相关对...
我正在学习Python,并试图在flask中创建一个字谜创作器。我正在使用nltk,并且已经设置了一个基本的脚本,它可以对一组字母进行解扰并找到单词 ...
sklearn中的countvectorizer是否只适用于英语?
Count_vect = CountVectorizer() xv=count_vect.fit_transform([...]。
我有一段文字,想找到例如:All Animals All Superlatives 有什么 "简单 "的方法吗?我对NLP完全陌生。我甚至不确定这是否是一个NLP问题。或者说...
如何使用python中的word tokenize函数删除列表中的数字?我得到的是输出,但我需要的是没有数字的输出。
我不需要列表中的数字(如:0,1等)。我需要打印没有编号的元素 import pandas as pd from nltk.tokenize import word_tokenize import csv # define punctuation ...
Pandas NLTK - 将自然语言处理列中的所有行进行标记化。
==使用Juypter Notebooks== 我让NLTK处理一串文本。Text= 'Hey. I got some text here' def preprocess(send): sent = nltk.word_tokenize(send) sent = nltk.pos_tag(...)
当我在 python 2.7 解释器终端写下 import nltk 这一行时,显示 SyntaxError:Invalid Syntax Traceback (最近一次调用)。文件" ",第1行,在 ...
我有一个句子列表,基本上我的目的是替换所有不同形式的介词出现 "oppo,nr,off,abv,behnd",用它们正确的拼写 "opposite,near,over,behind "等等......。
Pandas和NLTK:如果NLTK标记中包含子串,则用相邻列的子串替换空单元格。
我有一个由PRODUCT NAMEs和MAKERs组成的表。我有一个由PRODUCT NAMEs和MAKERs组成的表,其中有些MAKERs单元格是空的,因此我想写一个代码,将MAKER列中的空单元格替换成PRODUCT NAMEs中的子串......。
StanfordCoreNLP中的解析树和Stanza中的解析树给出了不同的结果(表示结构)
我使用StanfordCoreNLP做了依赖性解析,使用下面的代码 from stanfordcorenlp import StanfordCoreNLP nlp = StanfordCoreNLP('stanford-corenlp-full-2018-10-05', lang='en') sentence = 'The ...
我需要NLTK中的一种方法来计算文本主观性的分数(实数)。NLTK中有没有类似的方法? some_magic_method(my_text): ... # 0.34
NLTK ne_tree Word从列行中提取Tokenize chunk (PythonPandasJupyter)
我刚刚开始学习自然语言工具箱。我试图对单词进行分类。我基本上在寻找Person、Places和Organizations这些东西。到目前为止,定义一行文字......。
属性错误:'模块'对象没有属性'sentine_bleu'。
在ltk.translate的文档中,我可以清楚地看到有这个ltk.translate.bleu_score.sentence_bleu函数可以使用。但是当我把它用在我的脚本中时,却显示出了下面的......。
当使用 nltk 软件包对阿拉伯文进行标记时,结果显示为数字!在对英文文本进行标记时没有问题。当使用 nltk 包来标记阿拉伯文文本时,结果显示为数字!而标记英文文本时则没有问题。UnicodeDecodeError: 'ascii' codec can't decode byte 0xd8 in ...
我有一个脚本,主要是为自然语言工具箱工作。它的工作原理是使用NLTK对单个单词进行标记和标签(分类)。当我的列表包括名称和实体时,它...
如何使用 "pip install -r requirements.txt "通过 "requirements.txt "下载NLTK体例?
你可以通过命令行下载NLTK体例的punkt和wordnet: python3 -m nltk.downloader punkt wordnet 如何通过requirements.txt下载NLTK体例,使用pip install -r requirements...。