我想在我非常庞大的语料库上成功运行LDAseq模型。我最终想从中提取100个主题。
我在ldaseq模型步骤中收到“内存不足”错误。这是因为我有一个巨大的令牌,并且我不想截断它。如何解决此内存问题?
我的预期结果与文档中所示的相同。最后,我需要一个主题词和主题文档矩阵。
在gensim.corpora.MMcorpus]的MMCorpus上使用>它类似于易于构建的UCI Bow。https://radimrehurek.com/gensim/corpora/mmcorpus.html