我的数据包含开放式问题的答案:推荐您所在组织的原因是什么?
我想使用一种算法/技术,使用这些数据,学习最常出现的类别(即原因),并且可以自动将这个问题的新答案放在这些类别之一中。
我最初想到的是主题建模(例如LDA),但文本文档在这个问题上非常短(大多数在每个文档的1到10个单词之间)。因此,这是一个合适的方法吗?或者还有其他适合此类型的型号吗?也许是一种集群方法?
注意:文本是荷兰语