在过去的几天里,我一直在尝试使用多种语言的工具理解主题建模。这是我一直试图理解的工具。
https://code.google.com/p/topic-modeling-tool/
我的第一个问题是要知道它是否适用于其他语言,如印地语,西班牙语,法语和许多其他语言。
如果它适用于其他语言,那么任何人都可以解释印地语,西班牙语等语言的输入程序吗?我知道它对英语很有用。请帮帮我。提前感谢大家。
根据讨论here,人们一直在使用法语和俄语
您可能喜欢这个其他开源项目:https://github.com/ArtificiAI/Multilingual-Latent-Dirichlet-Allocation-LDA
这是一个关于如何将它用于多种语言的教程,并解释它的作用:https://github.com/ArtificiAI/Multilingual-Latent-Dirichlet-Allocation-LDA/blob/master/Multilingual-LDA-Pipeline-Tutorial.ipynb