text-mining 相关问题

文本挖掘是从非结构化(文本)信息中获取高质量信息的过程。

'Word2Vec'对象没有属性'index2word'

我收到此错误“AttributeError:'Word2Vec'对象在python中的以下代码中没有属性'index2word'”。谁知道我怎么解决它?实际上“......

回答 1 投票 1

LDA模型可以用于句子(而非文档)聚类/分类吗?

最近,我正在研究句子分类问题,这些句子只不过是关于产品和客户的一两条评论,那里有关于产品的各种功能的反馈...

回答 3 投票 -1

text-mining:确定动词所指的名词?

我正在试图找到一个包/库,这使我能够确定一个动词所指的名词(在Python中):该男子走在街上这会给我一个像走路的结果指......

回答 1 投票 2

如何在python中的pandas数据帧中执行词干和删除列?

下面是我的数据集的子集。我正在尝试使用nltk包中提供的Porter stemmer来清理我的数据集。我想删除它们的茎类似的列,例如“......

回答 1 投票 0

如何返回由|分隔的所有可能类别在一栏下

我有一个名为“genre”的数据集“movie”,其值类似于“Action”,“Action | Animation”,“Animation | Fantasy”。电影可以有多种类型。我想输出一份清单......

回答 3 投票 2

StringToWordVector Weka输出

我有一个包含一组文本句子的arff文件。我想获得每个句子中每个单词的绝对频率。我使用了StringToWordVector。这是起始文件@ ...

回答 1 投票 0

R中总是一起出现的词

我正在使用R并且我的数据集中有一个文本列,我需要知道是否有任何方法可以知道这些词总是在一起。像大多数两个词汇在一起或三个字......

回答 1 投票 0

R不承认阿拉伯语

我正在处理R中的阿拉伯语数据,因此我设置了本地阿拉伯语,如此处所示Sys.setlocale(“LC_CTYPE”,“arabic”)。然后我打开数据并将其分配给变量,我可以读取它...

回答 1 投票 0

将IRC档案整理到语料库中以进行文本挖掘

假设我想在归档的IRC上进行文本挖掘,并希望使用诸如此类的存档作为源来解析语料库数月和数年。在R中,总体战略将是什么......

回答 1 投票 0

检查英语词典中是否存在单词r

我正在对mutliple简历执行一些文本分析,使用wordcloud包和tm包生成wordcloud,用于预处理R中的文档语料库。我面临的问题是:...

回答 2 投票 1

解释Doc2Vec向量集群表示

我是Doc2Vec的新手,请忍受天真的问题。我已经生成了Doc2vector得分,即使用'Paragraph Vector'算法。我有一个每个文档的数组输出。我用的是模特....

回答 1 投票 0

是否有R技术来group_by,搜索和匹配长数据结构?

这是从每个id的5个单词的列表中找出哪些id具有匹配单词的问题。我们有一个带有id和单词的文本挖掘项目的长数据结构。每个group_id有5个......

回答 2 投票 0

R中使用余弦的术语聚类和可视化

我是文本挖掘和R的新手。我使用一组文档中的kmeans进行术语聚类。在对术语进行分组时,我使用了余弦公式。我要集群的有839个文件的57个术语。但......

回答 2 投票 0

如何从Jupyter上的计算机加载文件夹(带有文本文件),以便能够一起运行它们的分析?

我试图从我的WINDOWS计算机的桌面上加载我的Jupyter笔记本(Python 3)上的文件夹(包含大约1000个.txt文件);这样我就可以继续进行有关NLP的分析。我是 ...

回答 1 投票 0

如何在python的字典中使用NLTK countvectorizer?

我用csv阅读器来读取我的tsv文件,其中包含三列谎言,情感和评论。我创建了dicitonary来读取我的tsv文件数据,如下面的代码所示。下一个。我想要 ...

回答 1 投票 0

如何使用python删除单词中的空格?

这是John给国际象棋和l u d o的输入。我希望输出采用这种格式(如下所示)约翰下棋和卢多。我已经尝试使用正则表达式来删除空格但不...

回答 2 投票 1

挖掘数据帧以获得一系列独特的单词

我想在数据帧中取一组字符串,然后打破这些字符串以获得字符串中不同单词的计数。最终的想法是这样的:字1:5倍字2:3 ......

回答 1 投票 1

在Python中擦除文本文件的一部分

我的硬盘中有一个文本文件非常大。它有大约800万个json文件,用逗号分隔,我想删除最后一个json;但是,因为它真的很大我不能......

回答 2 投票 0

顺序字符串分块

我有一个字符串列表,我希望将其分块为包含三个元素的子列表,列表中的元素(i),前一个元素(i-1)和下一个元素(i + 1)。我也会......

回答 2 投票 0

词性(POS)与句法依赖性解析

我正在使用SpaCy进行文本分析,但我无法理解词性(POS)和句法依赖性解析之间的区别。两者都根据其角色标记句子中的单词。但是怎么......

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.