stop-words 相关问题

停用词是在处理自然语言数据之前(或之后)过滤掉的词。

使用lambda删除停用词并将其他停用词添加到停用词列表中

i具有包含41,000行Flickr标签的多列数据框。我只想从一列中删除所有英语停用词,而其他列则保持不变。这是我的代码提取的停用词列表...

回答 1 投票 0

如何从使用nltk停用词的列表中的标记组成的子列表中删除停用词

我的列表如下:mylist = [['how','to','unlock','my','bajaj','finance','emi','card'],['how','到','解锁','我','卡片'],['如何','到','解锁','我','卡片','告诉','我','那个','什么,...

回答 1 投票 0


[python 3求解数据框

试图从包含阿拉伯语句子的csv文件中删除停用词,但我不确定我得到了很多错误,我的代码print(tokenized_docs_no_punctuation)stop = set(stopwords.words('...

回答 1 投票 1

如何对不带停用词的solr进行排序

我正在尝试通过忽略停用词的字段来对solr查询进行排序,但似乎找不到找到这种方法的方法。例如,我希望对结果进行排序:Charlie A Fox Helicopter这是...

回答 3 投票 3

tm_map:可以将removewords功能与我自己的停用词一起注册为txt文件吗?

我正在使用R tm包对一个Facebook组进行文本分析,并发现removewords功能不适用于我。我试图将法语停用词与我自己的停用词结合使用,但它们仍然是...

回答 1 投票 0

从另一个文件的文本中删除文件中定义的所有停用词(Python)

我有两个文本文件:Stopwords.txt->每行包含一个停用词text.txt->大文档文件我正试图从中删除所有出现的停用词(stopwords.txt文件中的任何单词) ...

回答 3 投票 0

从python文件中删除文本文件中的停用词

我有两个文本文件:Stopwords.txt->每行包含一个停用词text.txt->大文档文件我正在尝试从中删除所有出现的停用词(stopwords.txt文件中的任何单词) ...

回答 2 投票 0

如何找出停用词并计数是否存在

我有一个csv文件,其中包含行中的句子列表,我想找出每行中是否有停用词,如果存在则返回1,如果存在则返回0。如果返回1,我要计算停用词。 ..

回答 1 投票 0

如何使用tf-idf选择停用词? (非英语语料库)

我设法评估了给定语料库的tf-idf函数。如何找到每个文档的停用词和最佳词汇?我了解给定单词和文档的低tf-idf意味着...

回答 2 投票 7

摆脱停用词和使用NLTK的文档标记化

我在使用nltk消除和标记.text文件时遇到困难。我不断收到以下错误消息:AttributeError:“列表”对象没有属性“较低”。我只是想不通...

回答 4 投票 5

Elasticsearch - 如何突出仅供精确文字匹配停止词?

是否有可能以突出它发生在一个短语停止的话,而不是强调其单独出现停止的话吗?例如,我想强调的“指环王”,“环”,或“主”。但是我 ...

回答 1 投票 0

NLTK停用词可用的语言

我想知道在哪里可以找到NLTK停用词的受支持lang(及其键)的完整列表。我在https://pypi.org/project/stop-words/中找到了一个列表,但其中不包含...

回答 2 投票 1

向nltk中止列表添加单词

我有一些代码可以从数据集中删除停用词,因为停用列表似乎也无法删除我想要的大多数单词,因此我希望将单词添加到此停用列表中,以便...

回答 9 投票 10

如何使用nltk或python删除停用词

所以我有一个数据集,我想删除停止词使用stopwords.words('english')我正在努力如何在我的代码中使用它只是简单地取出这些单词。我有一份清单......

回答 8 投票 94

如何使用python删除文件中的特殊字符和停止单词?

我是python的新手,并努力使代码从文件中删除停用词和特殊字符而不使用nltk。我尝试阅读并从其他问题中获取想法,但没有人帮助我。 ...

回答 1 投票 0

SQL Server 2008:使用CONTAINS关闭全文搜索查询的选择停用词

有一个使用Microsoft SQL Server并且需要搜索数据的应用程序,发现对于类似“系列6”或“66系列”的查询会返回结果,就好像它们有'系列'和...

回答 1 投票 0

尽管使用了StopAnalyzer和StopFilter,Apache Lucene也不会过滤停用词

我有一个基于Apache Lucene 5.5 / 6.0的模块,用于检索关键字。一切都很好,除了一件事 - Lucene没有过滤停止词。我尝试用...启用停用词过滤

回答 2 投票 2

拥有LUIS Intent的替代方案

要求是从聊天窗口中给出的用户输入中捕获关键字,并进行web api调用以获取文件链接。我有四个不同的类别,用户输入查询可以...

回答 1 投票 0

如果行只包含停用词中的任何一行,则从文本文件中删除这些行

我想从Myfile.txt文件中删除那些行,如果该行仅包含且仅包含任何来自停用词的行,例如,Myfile.txt文件的样本是Adh Dhayd Abu ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.