确定分类问题的最佳算法

问题描述 投票:0回答:1

我有一个由人口普查数据(年龄,性别,就业类型,种族,教育程度等)组成的数据集。我的任务是编写一个算法,预测数据点(30,男性,白人等)的年收入是否超过5万美元。

到目前为止,我实施了一个运行30个小时的KNN算法,但测试数据的准确率达到了约90%。我希望使用SVM算法或Naive Bayes或其他任何可能在这里工作的东西来获得更高的准确性。

我正在寻找一种在python中实现相对简单(与KNN一样难)的算法,并且很可能实现良好的准确性。在这种情况下,最好的选择是什么?如果KNN是最佳选择,哪种算法最容易实现以进行比较?

python machine-learning svm knn
1个回答
0
投票

很难说先验哪种算法会表现得更好。通常,对于传统的分类任务,例如你的,随机森林,梯度提升机器和SVM通常会给出最好的结果。

我不知道你的意思是通过寻找一个“相对简单的实现”的算法,但是如果你使用scikit-learn,已经实现了很多算法并且适合一行或两行代码,所以你可以尝试所有!

© www.soinside.com 2019 - 2024. All rights reserved.