我一直在尝试不同的方法来确定LDA中的主题频率(在R中)并且偶然发现了非常有用的包ldatuning但是无法真正找出控制参数,特别是种子的示例值。
以下是该网站的示例代码:
library("topicmodels")
data("AssociatedPress", package="topicmodels")
dtm <- AssociatedPress[1:10, ]
result <- FindTopicsNumber(
dtm,
topics = seq(from = 2, to = 15, by = 1),
metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"),
method = "Gibbs",
control = list(seed = 77),
mc.cores = 2L,
verbose = TRUE
)
我玩了一些参数并注意到种子值的变化非常显着地改变了输出图。有人可以解释一下这个案例中的77代表什么,以及如何选择种子的价值?
另外,我找不到任何其他选项来输入控件以及对结果有什么影响。如果有人能在这里提供一些很好的指导。
seed:类“整数”的对象;用于在VEM估计的外部代码中设置种子,并为Gibbs采样调用set.seed。对于吉布斯采样,它也可以设置为NA(默认值),以避免在模型拟合调用中更改随机数生成器的种子。