我在为数据挖掘任务选择正确的分类器时遇到问题。
我使用统计方法来标记网页,并使用 1-4 等级来标记它们,1 是最差的,4 是最好的。
之前,我使用 SVM 来训练系统,因为当时我使用的是二进制 (1,0) 标签。但现在自从我切换到这个 4 类标签后,我需要更改分类器,因为我认为 SVM 分类器仅适用于二类分类(如果我错了,请纠正我)。
哪种分类器最适合我的分类目的?
存在多类SVM。 LibSVM 有一个实现,Weka 也有。
通常最好尝试多个分类器,以找出哪一个最适合您的数据。分类器类型和训练算法的选择远没有特征集的选择那么重要。您可以尝试朴素贝叶斯、多类 SVM、MaxEnt、投票感知器或您的库提供的任何工具。
(如前所述,它也在 libSVM 中实现)、使用逻辑回归,甚至使用决策树或人工神经网络来完成修改。 您甚至可以继续您的标签,执行您选择的回归分析,然后对输出进行离散化。我上面提到的大多数方法都是在幕后完成的。
祝你好运