nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

使用 n-gram 模型 NLTK 预测下一个词

我正在尝试使用 NLTK 运行 N-Gram 语言建模代码,该代码取自 https://www.geeksforgeeks.org/n-gram-language-modelling-with-nltk/。但它抛出一个错误。 # 生成

回答 0 投票 0

加载停用词时出错:<urlopen error [Errno 110] Connection

下载 NLTK stopwords 时,出现以下错误 [nltk_data] 加载停用词时出错: 使用的代码是 进口

回答 1 投票 0

如何在python中使用Rake算法设置提取的单词数?

当使用 Rake 提取关键字时,该算法会创建其候选词组并根据它们的分数对它们进行排名,并返回至少具有一定分数的词组。 我怎样才能设置这个最小值...

回答 0 投票 0

如何删除 NLTK 停用词列表中的一些词

我想为 nltk 提供的停用词列表添加一些词。我有一个 csv 文件,其中包含我想添加到列表中的停用词,但它不起作用。这是我试过的:

回答 0 投票 0

从句子中提取相关日期和地点

我正在处理包括地点和日期的书面文本(文章和书籍的段落)。我想从文本中提取包含地点和日期的相关对...

回答 1 投票 0

Python - 是否有英语GB词的NLTK语料库?

我正在学习Python,并试图在flask中创建一个字谜创作器。我正在使用nltk,并且已经设置了一个基本的脚本,它可以对一组字母进行解扰并找到单词 ...

回答 1 投票 0

sklearn中的countvectorizer是否只适用于英语?

Count_vect = CountVectorizer() xv=count_vect.fit_transform([...]。

回答 1 投票 0

用python在文本中寻找具有特定标准的单词。

我有一段文字,想找到例如:All Animals All Superlatives 有什么 "简单 "的方法吗?我对NLP完全陌生。我甚至不确定这是否是一个NLP问题。或者说...

回答 1 投票 0

如何使用python中的word tokenize函数删除列表中的数字?我得到的是输出,但我需要的是没有数字的输出。

我不需要列表中的数字(如:0,1等)。我需要打印没有编号的元素 import pandas as pd from nltk.tokenize import word_tokenize import csv # define punctuation ...

回答 1 投票 0

Pandas NLTK - 将自然语言处理列中的所有行进行标记化。

==使用Juypter Notebooks== 我让NLTK处理一串文本。Text= 'Hey. I got some text here' def preprocess(send): sent = nltk.word_tokenize(send) sent = nltk.pos_tag(...)

回答 1 投票 0

在python 2.7中导入ntlk时语法无效。

当我在 python 2.7 解释器终端写下 import nltk 这一行时,显示 SyntaxError:Invalid Syntax Traceback (最近一次调用)。文件" ",第1行,在 ...

回答 1 投票 1

用Soundex, python替换单词

我有一个句子列表,基本上我的目的是替换所有不同形式的介词出现 "oppo,nr,off,abv,behnd",用它们正确的拼写 "opposite,near,over,behind "等等......。

回答 2 投票 3

Pandas和NLTK:如果NLTK标记中包含子串,则用相邻列的子串替换空单元格。

我有一个由PRODUCT NAMEs和MAKERs组成的表。我有一个由PRODUCT NAMEs和MAKERs组成的表,其中有些MAKERs单元格是空的,因此我想写一个代码,将MAKER列中的空单元格替换成PRODUCT NAMEs中的子串......。

回答 1 投票 0

StanfordCoreNLP中的解析树和Stanza中的解析树给出了不同的结果(表示结构)

我使用StanfordCoreNLP做了依赖性解析,使用下面的代码 from stanfordcorenlp import StanfordCoreNLP nlp = StanfordCoreNLP('stanford-corenlp-full-2018-10-05', lang='en') sentence = 'The ...

回答 1 投票 0

如何在NLTK中获取文本的主观性分数?

我需要NLTK中的一种方法来计算文本主观性的分数(实数)。NLTK中有没有类似的方法? some_magic_method(my_text): ... # 0.34

回答 1 投票 2

NLTK ne_tree Word从列行中提取Tokenize chunk (PythonPandasJupyter)

我刚刚开始学习自然语言工具箱。我试图对单词进行分类。我基本上在寻找Person、Places和Organizations这些东西。到目前为止,定义一行文字......。

回答 1 投票 0

属性错误:'模块'对象没有属性'sentine_bleu'。

在ltk.translate的文档中,我可以清楚地看到有这个ltk.translate.bleu_score.sentence_bleu函数可以使用。但是当我把它用在我的脚本中时,却显示出了下面的......。

回答 1 投票 0

Python nltk不能标记阿拉伯语文本

当使用 nltk 软件包对阿拉伯文进行标记时,结果显示为数字!在对英文文本进行标记时没有问题。当使用 nltk 包来标记阿拉伯文文本时,结果显示为数字!而标记英文文本时则没有问题。UnicodeDecodeError: 'ascii' codec can't decode byte 0xd8 in ...

回答 2 投票 0

跳过没有属性的元组 Python NLTK

我有一个脚本,主要是为自然语言工具箱工作。它的工作原理是使用NLTK对单个单词进行标记和标签(分类)。当我的列表包括名称和实体时,它...

回答 1 投票 0

如何使用 "pip install -r requirements.txt "通过 "requirements.txt "下载NLTK体例?

你可以通过命令行下载NLTK体例的punkt和wordnet: python3 -m nltk.downloader punkt wordnet 如何通过requirements.txt下载NLTK体例,使用pip install -r requirements...。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.