How to create a Document Term Matrix in R (using LSA)?

问题描述 投票:0回答:0

我正在尝试使用 LSA 包为我在 R 中的研究构建一个文档矩阵。 我试图读取的 txt 文件包含来自 10,000 条推文的文本,并且其中有数据。但是加载 TDM 会导致以下错误。 我正在使用这个包,因为它与我正在使用的一篇论文有关,并且还有一些其他有趣的工具供以后使用。该论文位于:Gefen, D.、Endicott, J. E.、Fresneda, J. E.、Miller, J. 和 Larsen, K. R.(2017 年)。带注释代码的 R 中带有潜在语义分析的文本分析指南:研究在线评论和堆栈交换社区。信息系统协会通讯,41(1), 21.

有人能帮忙吗?谢谢

下面是我的代码:

install.packages("LSAfun") 图书馆(LSAfun) 图书馆(lsa)

#加载停用词

数据(stopwords_en)

#加载文本

source_dir = "C:\Users\Alexander Hiscock\Desktop\Phd R Stuff xport_txt2"

#创建 tdm

时分管理 <- textmatrix(source_dir, stopwords= stopwords_en, stemming=TRUE, removeNumber=FALSE, minGlobFreq=2)

时分复用 if ((nc <= (3 * bag_cols)) && (nr <= (3 * bag_lines))) { : missing value where TRUE/FALSE needed`

r topic-modeling lsa
© www.soinside.com 2019 - 2024. All rights reserved.