nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

在另一个 Text() 中单击单词时替换 Tkinter ScrolledText() 中的单词

这里我有一段代码执行以下操作: 它允许用户输入文本。 它通过标记它们来突出显示红色拼写错误的单词(礼貌-@OysterShucker) 当突出显示的单词为

回答 1 投票 0

使用nltk.download()下载错误

我正在使用Python试验NLTK包。我尝试使用 nltk.download() 下载 NLTK。我收到这样的错误消息。如何解决这个问题呢?谢谢。 我使用的系统是Ubuntu ins...

回答 7 投票 0

从头开始在Python中获得Bleu分数

在观看 Andrew Ng 关于 Bleu 分数的视频后,我想用 python 从头开始实现一个。我用 python 和 numpy 编写了完整的代码。这是完整的代码 将 numpy 导入为 np ...

回答 4 投票 0

Python NLTK 文本分散图的 y 纵轴是向后/相反的顺序

自上个月以来,NLTK离散图似乎在我的机器上有相反的y(垂直)轴。这可能与我的软件版本有关(我使用的是学校虚拟机)。 版本...

回答 1 投票 0

使用 Python 计算给定句子中 T 单元的数量

我一直在从事第二语言开发项目。我需要使用 Python 计算给定句子的 t 单位。例如,对于以下句子: 这个男人不喜欢水。 1吨-

回答 1 投票 0

用于简短描述的名称、实体、产品、地点识别的预训练模型(Spacy、NLTK 等)

我的描述非常简短,不超过40个字符。我使用 Spacy 的 NER 模型来识别名称、实体、产品和食品。 我的文字描述的问题是非常短......

回答 1 投票 0

为什么我的 tf-idf 值看起来不一致?

我有一系列已转换为代币的推文。其中包括以下内容: 杰拉尔德库特尼发生了意识到发生了方便的重命名捕获但紧急事后政府来了 迈克尔...

回答 1 投票 0

Hazm:POSTagger():ArgumentError:参数2:<class 'TypeError'>:类型错误

我运行以下代码时出错。你可以给我一些帮助吗? 从 __future__ 导入 unicode_literals 从危险进口* tagger = POSTagger(model='resources/postagger.model') 标记者....

回答 1 投票 0

nltk.download('punkt') 给出的输出为 false

这是我的代码: df['num_words'] = df['text'].apply(lambda x:len(nltk.word_tokenize(x))) 这给了我以下错误: 未找到资源点。 请使用 NLTK 下载器获取

回答 1 投票 0

尝试在公司计算机上运行 #nltk.download('stopwords')) 代码时,如何修复 nltk.download [Win Errorr 10054]?

我正在尝试使用nltk,我需要下载nltk.download()数据。我在我的工作计算机上尝试了很多东西,但我不确定是否是我们的防火墙,或者是否有其他东西......

回答 1 投票 0

如何在nltk中下载punkt tokenizer?

最近我使用下载了NLTK库 “pip 安装 nltk” 在使用库时 “从nltk.tokenize导入sent_tokenize 发送令牌化(文本)” 我收到这个错误 ***...

回答 2 投票 0

NLTK Sentence_bleu() 在评估中文句子时返回 0

我正在尝试使用NLTK的sentence_bleu()函数评估中文句子BLEU分数。代码如下: 导入nltk 进口解霸 从转换器导入 AutoTokenizer、BertTokenizer、

回答 1 投票 0

TypeError:序列项 1:预期的 str 实例,未找到 NoneType

我创建了这个程序来自动检查文章中的单词并提供更正,但是在运行它时,我在 .join 调用中不断收到上述错误。这是代码 导入nltk 来自 nltk.corpus 我...

回答 1 投票 0

如何使用 NLTK 分词器去除标点符号?

我刚刚开始使用NLTK,不太明白如何从文本中获取单词列表。如果我使用 nltk.word_tokenize(),我会得到单词和标点符号的列表。我只需要文字......

回答 13 投票 0

从Python NLTK或其他模块中的任何单词获取音素?

Python NLTK 具有 cmudict,可以输出已识别单词的音素。例如 'see' -> [u'S', u'IY1'],但对于无法识别的单词,它会给出错误。例如“seasee”-> 错误。 我...

回答 5 投票 0

语法“variable_name: type: another_type”在Python中意味着什么?

我在研究nltk时,在nltk.corpus的init.py文件中发现了一个以前从未见过的语法。 cess_cat: BracketParseCorpusReader = LazyCorpusLoader( “cess_cat”,

回答 1 投票 0

更快的方式 NLTK 中的独特词频

我的数据框有 230 万行。我试图从中找出最常用的 100 个单词。我不需要标点符号、动词、数字和 ('a','the','an') 我在 python 中使用以下查询,但需要先...

回答 1 投票 0

Python NLTK Wordnet 问题

使用的代码- Augmenter=naw.SynonymAug(aug_src='wordnet', model_path=None, name='Synonym_Aug', aug_min=1, aug_max=10, aug_p=0.3, lang='eng', stopwords=stop_words,tokenizer=None,reverse_tokenizer=None,

回答 1 投票 0

Nltk 分词器问题

来自 nltk.tokenize 导入 RegexpTokenizer 分词器 = RegexpTokenizer(r'\w+') dataset['text'] = dataset['text'].apply(lambda word_list: [tokenizer.tokenize(word) for word_list]) 数据集['te...

回答 1 投票 0

Python 的斯坦福解析器:输出格式

我目前正在使用斯坦福解析器的Python 接口。 从nltk.parse.stanford导入StanfordParser 导入操作系统 os.environ['STANFORD_PARSER'] ='/Users/au571533/Downloads/

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.