'种子'在'ldatuning'中做什么来确定LDA主题频率(在R中)?

问题描述 投票:1回答:1

我一直在尝试不同的方法来确定LDA中的主题频率(在R中)并且偶然发现了非常有用的包ldatuning但是无法真正找出控制参数,特别是种子的示例值。

以下是该网站的示例代码:

library("topicmodels")
data("AssociatedPress", package="topicmodels")
dtm <- AssociatedPress[1:10, ]

result <- FindTopicsNumber(
  dtm,
  topics = seq(from = 2, to = 15, by = 1),
  metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"),
  method = "Gibbs",
  control = list(seed = 77),
  mc.cores = 2L,
  verbose = TRUE
)

我玩了一些参数并注意到种子值的变化非常显着地改变了输出图。有人可以解释一下这个案例中的77代表什么,以及如何选择种子的价值?

另外,我找不到任何其他选项来输入控件以及对结果有什么影响。如果有人能在这里提供一些很好的指导。

r lda topic-modeling
1个回答
0
投票

seed:类“整数”的对象;用于在VEM估计的外部代码中设置种子,并为Gibbs采样调用set.seed。对于吉布斯采样,它也可以设置为NA(默认值),以避免在模型拟合调用中更改随机数生成器的种子。

© www.soinside.com 2019 - 2024. All rights reserved.