我有一个CSV文件,其中有4个自变量和1个因变量。应该预测因变量,并且它是分类的。它有7个类别。假设这些类别是A,B,C,D,E,F,G。我使用Azure Machine Learning Studio和python只是为了与编码部分取得联系。贝娄的图片显示了Azure ML中可用的一些机器学习算法。
那么在这种情况下使用的最佳机器学习算法是什么?如果自变量的数量增加怎么办?我仍然可以使用相同的算法吗?
根据可用数据,您可以使用scikit-learn训练模型并查看预测结果。选择正确的算法可能会有所帮助:https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html