nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

如何在python中计算2个单词的距离

我必须提取数据库并将其放入python脚本中。我做了所有数据库名称。现在,我必须计算名称1和名称2之间以及...

回答 2 投票 0

正则表达式包括字母,特殊字符,数字

以下是我的句子:例如:这是第一个:示例234-这是第二个(示例)345 1这是我的第三个示例(456)3预期输出:['this is first:example',234,-] [ '...

回答 1 投票 1

使用guess_language阅读30000条推文

我正在使用guess_language检测学校项目推文的语言。我使用熊猫读取.csv文件。我大约有30000行。但是,我的问题是猜测语言可以...

回答 1 投票 0

启动情感分析项目的最佳实践?

在我对AI和情感分析进行了大量研究之后,我发现了两种进行文本分析的方法。在对文本进行预处理之后,我们必须创建一个分类,以便获得...

回答 1 投票 0

PYTHON:删除推文中的非英文文本

我有一个至少500万行的数据框,我正在尝试删除“纯”非英语推文。但是,我的问题是,当我尝试删除它们时,所有推文都消失了,因为它们都提到了一个...

回答 1 投票 0

如何获得数据帧中每一行的特定单词的频率

我正在尝试创建一个函数,该函数从数据框中获取特定单词的频率。我正在使用Pandas将CSV文件转换为数据框,并使用NLTK将文本标记化。我能够得到...

回答 1 投票 0

生成短语

[能否请您给出一些提示,例如,我输入的内容是-“我想要我的帐户详细信息”,输出应类似于我可以获取我的帐户详细信息,请提供我的...

回答 1 投票 1

生成短语

[请您提供一些提示,例如我输入了“我想要我的帐户详细信息”时,输出应该像我可以获取我的帐户详细信息请提供我的帐户...

回答 1 投票 0

tfidf首次用于在每个条目都有列表的熊猫系列中

[数据看起来像这样:data_clean2.head(3)文本目标0 [行为,原因,地震,可能,安拉,宽恕,你] 1 1 [森林,大火,附近,拉,荣,萨斯省,加拿大] 1 2 [残留物,询问,住所,...

回答 1 投票 0

在这种情况下使用的最佳python数据结构是什么?

我试图找出在代码中使用的最佳数据结构,我考虑了字典,字典列表,类等,但是不确定哪种方法最有效,最快地使用。 ...

回答 2 投票 -2

[使用基于规则的处理在Python 3中读取开头和结尾之间的行

我的文字行很长,想读两个单词之间的文字。这是一个标准格式的大文本文件,如下所示:第一段(空行)在此文件中包含不同单词的随机行。 ...

回答 1 投票 0

NLTK中最高效的解析器?

[我找不到NLTK中的解析算法,当使用大语法实例化时(在Penn树库的20多个左右的文件名上进行训练...],它会在合理的时间内解析一个句子...

回答 1 投票 0

如何调整/重新训练NLTK SentimentIntensityAnalyzer

我正在使用NLTK的SentimentIntensityAnalyzer来获取有关航空公司服务的推文极性。关于食品质量和守时等方面有很多推文。使用下面的代码,我可以获得...

回答 1 投票 0

Python NLTK FreqDist-列出频率大于1000的单词

我正在尝试输出出现在令牌中的每个单词超过1000次(> 1000),并将其保存到freq1000。 freq1000 = [] newtokens = []用于令牌中的单词:newtokens + =单词FreqDist(...

回答 1 投票 0

如何使用nltk计算文本中存在的单词的频率

我有一个python脚本,可以读取文本并应用预处理功能以进行分析。问题是我想计算单词的出现频率,但是系统崩溃并显示...

回答 1 投票 0

Regex,查找所有均为大写字母的句子

我需要你的帮助。目前,我正在使用此代码段进行工作; altbaslik = []用于句子索引中的行:找到= re.match(r“ \ w * [AZ] \ w * [AZ] \ w * | [Ö|Ç|Ş|Ü|Ğ|İ]”,行) ...

回答 1 投票 0

WordNet语料库中的词语说明

我想获取WordNet语料库代码中的单词长度:从nltk.corpus导入wordnet,如wn len_wn = len([wn.words()中单词的word.lower()])print(len_wn)我得到输出为147306 My ...

回答 1 投票 0


当我尝试从python中的pandas数据框创建新列时,部分关键字匹配不起作用?

[我有一个数据框,描述如下,描述描述政府娱乐人与CFO委员会共进晚餐给特工政府,我正在尝试在...上搜索关键字] ...

回答 1 投票 3

根据条件格式化列表中元素的字符串

因此,我创建了一系列语法,供在我创建的类的方法中使用。每个列表的长度都可以是n个元素,因此通过列表索引放置每个单词是简单的假设wordword [1:],...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.