text-mining 相关问题

文本挖掘是从非结构化(文本)信息中获取高质量信息的过程。

年代情感分析 - 不能按行分组

我的数据文本是纯文本的小说。我使用了包tm和tidytext。数据处理进展顺利,我创建了DocumentTermMatrix而没有遇到任何问题。文本

回答 1 投票 1

可以自动找到停止词吗?

在NLP中,停用词移除是典型的预处理步骤。它通常是基于我们认为停止词应该是什么的经验方式来完成的。但在我看来,我们应该概括......

回答 5 投票 11

用syuzhet tm语料库进行的情感分析

我是R中文本分析的新手,是否有一种简单的方法将syuzhet:get_nrc_sentiment应用于具有x个元素的语料库(加载单个文本文件)?我猜你需要把语料库转回......

回答 1 投票 0

术语文档矩阵中的SVD不能给出我想要的值

我试图在一篇名为“LSA简介”的论文中复制一个例子:对LSA的介绍在这个例子中,他们有以下术语 - 文档矩阵:然后他们应用SVD并得到......

回答 2 投票 6

从PDF中提取文本会在R中返回奇怪的结果

我试图从一堆PDF中挖掘文本,但是当我使用pdftools包中的pdf_text将它们读入R时,它产生的文本很奇怪,就像PDF上的实际内容一样......

回答 1 投票 3

主题提取和文本分类之间的概念差异是什么?

我很困惑,文本挖掘的非常相似的服务有不同的名称,如主题提取和文本分类/分类。它们之间的概念差异是什么?话题 ...

回答 1 投票 1

运行hadoop wordcount示例时出现错误消息

我用这个命令在Hadoop中运行wordcound示例。 hadoop jar /usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount inputWiki / ...

回答 1 投票 -2

将功能应用于textreuse语料库

我有一个数据框如下:df

回答 1 投票 2

如何在单词列表中找到DF中的匹配单词并在新列中返回匹配的单词[重复]

我有一个带有2列的DF,我有一个单词列表。 list_of_words

回答 1 投票 -1

文本挖掘库或语言库?

我从我拥有的论坛收集了大量数据,并希望进行一些文本挖掘或使用一些语言库来提取有用的信息。任何文本挖掘,数据挖掘库中的任何...

回答 6 投票 0

使用带有R的停用词“tr”分析土耳其语文本的问题

我在R中分析土耳其语文本。但是在使用停用词“tr”时存在问题。虽然在指示的链接中,土耳其语用“tr”表示但它仍然无法识别它。这是 ...

回答 1 投票 0

如何将字符串与文本组与PHP进行比较

我有一个字符串组(“hello”,“hi”,“how ru”,“你好吗”,“你怎么样”,“你好吗”等),我想创建一个可以创建的函数将字符串变量(如$ varible =“Helloooo”)与...进行比较

回答 4 投票 0

如何在Pandas数据帧(Python)中查找语料库中最常用的单词

我有Pandas数据框,如下所示。我已经对我的文本文件进行了标记,并使用NLTK Countvectorizer转换为pandas数据帧。另外,我已经删除了停用词和......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.