我正在开发一个机器学习项目,它分析需求规范并将非功能性需求分类到数据库,Web套接字,后端技术等类别。正如我所研究的那样Naive Bayes是更好的分类方法,但由于缺乏数据集我计划使用Seed LDA进行主题建模。是否可以使用LDA或我应该使用别的东西?
您可以尝试LDA或群集。
根据我的经验,k-mean聚类可以帮助您更好地了解您在做什么以及发生了什么。
使用LDA,它也可能是好的。您可以先尝试一下,因为k-means需要更多时间。
我在这里用k-means实现了一个问题跟踪系统,你想看看吗? issue tracker