R stm包错误：“向量化的源必须具有正长度条目”

Question

我想我犯了一个非常简单的错误，但我是R的新秀，我很难搞清楚。我正在尝试使用R中的'stm'包对我抓取的推文数据集进行一些主题建模。

数据集格式化为两列，一列具有推文发送者的名称，列标题为“元”，另一列具有推文的词汇，列标题，“词汇”。运行下面的脚本后，我收到以下错误：

Error: is.Source(s) is not TRUE
In addition: Warning message:
In is.Source(s) : vectorized sources must have a positive length entry

library(stm)
library(igraph)
setwd("c:/Users/Adam/Desktop/RTwitter")

data <-read.csv("TweetDataSTM.csv")
processed <- textProcessor(data$documents, metadata = data)
out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
docs <- out$documents
vocab <- out$vocab
meta <-out$meta

> library(stm)
> library(igraph)
> setwd("c:/Users/Adam/Desktop/RTwitter")
> 
> rm(list=ls())
> 
> data <-read.csv("TweetDataSTM.csv")
> processed <- textProcessor(data$documents, metadata = data)
Building corpus... 
Error: is.Source(s) is not TRUE
In addition: Warning message:
In is.Source(s) : vectorized sources must have a positive length entry
> out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
Error in prepDocuments(processed$documents, processed$vocab, processed$meta) : 
  object 'processed' not found
> docs <- out$documents
Error: object 'out' not found
> vocab <- out$vocab
Error: object 'out' not found
> meta <-out$meta
Error: object 'out' not found

（任何建议将不胜感激！）

-亚当

Answer 1

我认为你的错误发生是因为你的列被命名为vocab和meta。但在这里

已处理的< - textProcessor（数据$文档，元数据=数据）

你试图调用一个列documents - 据我所知 - 你的data.frame中不存在。尝试将代码更改为：

processed <- textProcessor(data$vocab, metadata = data)

R stm包错误：“向量化的源必须具有正长度条目”

问题描述投票：1回答：1

1个回答

最新问题

R stm包错误：“向量化的源必须具有正长度条目”

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1