如何从短文本文档中提取类别?

问题描述 投票:-2回答:1

我的数据包含开放式问题的答案:推荐您所在组织的原因是什么?

我想使用一种算法/技术,使用这些数据,学习最常出现的类别(即原因),并且可以自动将这个问题的新答案放在这些类别之一中。

我最初想到的是主题建模(例如LDA),但文本文档在这个问题上非常短(大多数在每个文档的1到10个单词之间)。因此,这是一个合适的方法吗?或者还有其他适合此类型的型号吗?也许是一种集群方法?

注意:文本是荷兰语

nlp cluster-analysis text-mining topic-modeling
1个回答
© www.soinside.com 2019 - 2024. All rights reserved.