nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

在Wikipedia语料库上训练LDA来标记仲裁文章?

我按照gensim Python https://radimrehurek.com/gensim/wiki.html中的步骤在LDA模型上训练维基百科,现在我想比较来自cnn.com的任意文章与训练数据,...

回答 1 投票 0

立即下载google colaboratory中的所有nltk软件包

我想在google colab上的代码中使用停用词,当我导入关于nltk的东西时没有错误但是当我在我的代码中使用停用词时google colab给出了这个错误: - 资源'语料库/ ...

回答 2 投票 1

什么是文本分类的适当训练集大小(情感分析)

我只想了解(根据您的经验),如果我必须创建一个情绪分析分类模型(使用NLTK),那么什么是良好的训练数据大小。比如我的......

回答 1 投票 0

根据文件的音节数从文件中过滤单词

我需要从.txt文件中识别复杂的单词。我试图使用nltk但不存在这样的模块。复杂单词是文本中包含两个以上音节的单词。

回答 1 投票 -2

nltk.twitter给出401错误

我正在尝试收集推文并提取我的项目的文本部分。我尝试了很多方法,其中大多数对我来说都很好。虽然我偶然发现了这个nltk.twitter包和一些代码......

回答 2 投票 0

在setup.py脚本中安装nltk数据

我在项目中使用带有wordnet的NLTK。我在我的电脑上手动安装了pip:pip3 install nltk --user在终端中,然后nltk.download()在python shell中下载wordnet。我想要 ...

回答 2 投票 10

如何在输出Python上实现完美对齐? [重复]

我有两个列表,我想并排打印它们。 list1 = [(15,'dog'),(10,'leopard'),(5,'bird')] list1 = [(20,'table'),(23,'PC'),(13,'电视')]打印时我的输出是......

回答 1 投票 0

nltk是否包含阿拉伯语停用词,如果不包含,我该如何添加?

我尝试了这个,但它不起作用nltk.corpus import stopwords stopwords_list = stopwords.words('arabic')print(stopwords_list)更新[2018年1月]:nltk数据存储库已包含...

回答 2 投票 3

NLTK Chunk Parser:如何逃避特殊字符

所以我试图从文本中提取一些信息,我正在使用NLTK分块。这是我的投入股票显示67%的涨幅,去年跌幅为12%我想抓住67%的涨幅和12%的跌幅...

回答 2 投票 0

nltk中pos_tag和UnigramTagger以及BigramTagger有什么区别?

我试图弄脏我的手nltk。我指的是http://victoria.lviv.ua/../NaturalLanguageProcessingWithPython.pdf。它声明nltk.pos_tag函数为每个单词指定词性...

回答 1 投票 1

在NLTK和scikit-learn中结合文本词干和删除标点符号

我正在使用NLTK和scikit-learn的CountVectorizer组合来阻止单词和标记化。下面是CountVectorizer的简单用法示例:来自sklearn ....

回答 1 投票 20

为什么在处理DataFrame时我的NLTK功能会变慢?

我试图在数据集中运行我的百万行的函数。我在数据帧中从CSV读取数据我使用下拉列表来删除数据我不需要通过...中的NLTK函数传递它

回答 1 投票 0

如何获得与一个单词相关的类似单词?

我正试图解决一个nlp问题,我有一个单词的词典,如:list_1 = {'phone':'android','chair':'netflit','充电器':'macbook','laptop','sony '}现在,如果输入是'电话',我可以轻松使用'in'...

回答 1 投票 0

将NLTK代码重写为可在Python中多次使用的函数

如何将我的代码重写为可以再次调用的函数我的代码stopwords = nltk.corpus.stopwords.words('english')user_defined_stop_words = ['st','rd','kwun tong','kwai chung', 'kwun','tong'] ......

回答 1 投票 -3

在Python中使用NLTK的短语的一致性

是否有可能在NLTK中获得一个短语的一致性?从nltk.corpus导入nltk导入PlaintextCorpusReader corpus_loc =“c:// temp // text //”files =“。* \ .txt”read_corpus = ...

回答 3 投票 4

NLTK库失败

我正在尝试下载NLTK库。我已经运行了pip install。由于我使用anaconda,条件已经满足我运行import nltk nltk.download()我得到这个错误:...

回答 1 投票 -2

Truecasing - SpaCy

意图是基于POS标签进行大写,我可以借助以下链接实现这一点。如何才能最好地确定单词的正确大小写?试图取得类似的结果......

回答 1 投票 0

python tokenizer 2个单词短语到word2vec模型

我正在为word2vec使用python gensim包。我想在令牌化单词和双字短语上运行模型。我有10,000~文件,我使用nltk Regextoknizer获取单字标记......

回答 1 投票 0

确定两个单词是否来自Python中的同一个根

我想编写一个函数same_base(word1,word2),当word1和word2是从同一根词派生的两个英文单词时返回True。我意识到单词可以有多种感官;我想要 ...

回答 1 投票 3

我有python错误builtins.ImportError:没有名为'nltk.tokenize'的模块

我在脚本开头写了以下内容:从nltk.tokenize导入sword_tokenize然而,我收到以下错误:builtins.ImportError:没有名为'nltk.tokenize'的模块是什么...

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.