为什么random_state参数在NMF和LDA算法中使用?什么是使用每次生成随机话题的好处是什么?

问题描述 投票:1回答:1

对于主题建模, 为什么random_state参数在NMF和LDA算法中使用? 什么是使用每次生成随机话题的好处是什么?

python lda topic-modeling nmf
1个回答
1
投票

两种算法是随机的 - 这意味着他们使用随机性估计一个很好的答案的一部分。它这样做的方式,使之易于处理,并在LDA的情况下,整个模型是随机的,最好为您提供一个概率分布(称为“后验分布”)的答案,而是提供了一个单一的,有可能的答案作为估计。

所以答案是,在算法使用的随机性使得一个非常困难的问题更简单,可行的,在不到一百年来计算。

如果你打算使用它们,我认为它会做你好好学习他们,学习他们是如何工作的,为什么他们的工作什么的。使用的工具,你不明白是有风险的,因为你真的不知道什么工具提供的结果实际上意味着。一个例子是在所有的“主题”的numerors单词,概率非常低。在这些概率的差异实际上是毫无意义的 - 给从后一个不同的样本,你会得到不同的概率,单词之间有不同排列顺序。

© www.soinside.com 2019 - 2024. All rights reserved.