tm 相关问题

`tm`包(R中的Text Mining Infrastructure的简写)为R中的文本挖掘应用程序提供了一个框架。

在R中使用paste0的新列

我正在寻找一个允许我添加新列的函数,将名为ID的值添加到字符串中,即:我有一个带有您ID的单词列表:car = 9112 red = 9512 employee = 6117 sky = 2324。 ..

回答 1 投票 0

(R)关于DocumentTermMatrix中的停用词

我有一些关于DocumentTermMatrix()及其停用词的问题。我键入如下,但无法得到我想要的结果。文本

回答 1 投票 0

我不知道函数结果的预测结果是什么

简介在我的学校,我必须参加挑战,看看我是否理解了R中文本挖掘的工作方式。为此,我们有1050个不同类型的文件(购物,家庭,帐户等)....

回答 1 投票 -1

如何从R语料库中删除文本?

我正在使用tm包中的corpus_segment函数将长文档分成章节。运行模式后,我仍然留下了几个不需要的章节。我想以某种方式......

回答 1 投票 0

如何使用R中的'tm'包在语料库中设置TF权重

我想知道如何在tm包中得到术语频率权重(tf =文档中的术语/总项)矩阵

r tm
回答 2 投票 1

来自包`tm`的`tm_map`中的自定义函数

我试图将自定义函数添加到包tm的tm_map函数中,但是它将数据转换为我无法继续的不同格式。例如,我使用库(tm)...

r tm
回答 1 投票 0

使用R中的余弦距离的分层聚类

我想通过使用余弦相似性与文档语料库的R编程语言进行层次聚类,但是我得到以下错误:if(is.na(n)|| n> 65536L)中的错误停止(“...

回答 1 投票 1

在R中提取公共连续序列的函数

请告诉我,是否有从符号向量中提取常见连续字符序列的函数。即,例如,从输入的行向量:c(“妈妈肥皂框架”,“甜...

r tm
回答 1 投票 0

R - 如何将训练文档 - 术语 - 矩阵(dtm)中的术语应用于测试dtm(unigrams和bigrams)?

我正在训练一个关于1,000个训练样例的简单文本分类方法,并希望对看不见的测试数据进行预测(大约500,000个观测值)。脚本工作正常,当我......

回答 1 投票 0

stemCompletion无法正常工作

我正在尝试使用stemCompletion将词干转换成完整的单词。以下是我使用txt的代码

回答 3 投票 0

在R中加载LDA函数时出现问题

我正在使用文本挖掘tm库为R.我在R版本3.3.1上运行我有这个代码:lda

r tm
回答 1 投票 2

文档项矩阵到矩阵列表R.

我有一个文档术语矩阵dtm,例如:dtm < >非/稀疏条目:220/2497稀疏度:100%最大值...

回答 2 投票 1

如何从csv文件中读取表中的文本

我是新用的tm包。我想读一个csv文件,其中一列包含2000个文本,第二列包含因子变量yes / no到语料库中。我的意图是转换文字......

回答 3 投票 4

tm:读入数据框,保留文本ID,构造DTM并加入其他数据集

我正在使用包tm。假设我有一个2列,500行的数据框。第一列是随机生成的ID,其中包含字符和数字:“txF87uyK”第二列是......

回答 5 投票 10

DocumentTermMatrix与字典

我想将语料库转换为DocumentTermMatrix,只选择单词列表。我知道控制列表中的“字典”参数是这样的:a = list(“我是一个大的大苹果”,...

回答 1 投票 1

R - 采用levenshtein距离的多列文本挖掘

我想通过levenshtein距离(R中的adist函数)在多列中多次比较文本字符串。我想要做的是将source1 $ name与source2 $ name进行比较。如果有 ...

回答 1 投票 1

tm包R中的自定义标记生成器无法正常工作

请看下面的MWE,自定义标记器不起作用,为什么? tm包版本是0.71库(tm)ts

回答 1 投票 1


可能是关键概念吗?

我正在处理R中的文本挖掘,使用tm库。我知道如何提取关键字,但我想提取文档中经常“在一起”的单词的关联(例如,获取...

r tm
回答 2 投票 0

用syuzhet tm语料库进行的情感分析

我是R中文本分析的新手,是否有一种简单的方法将syuzhet:get_nrc_sentiment应用于具有x个元素的语料库(加载单个文本文件)?我猜你需要把语料库转回......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.