[在评估SVM,RF和DT的性能时(max_depth = 3),使用RF模型可以获得非常好的效果。建模的数据是真实世界的数据。由于数据集不平衡,因此它们均使用分层交叉验证进行评估。
对于之前见过的4个不同的类别,我得到了这些分数的准确性,回忆性和F1。
最初,数据集包含以下四个类别的以下values_counts:
RF如何比SVM和DT好得多?
谢谢!
[在评估SVM,RF和DT的性能时(max_depth = 3),使用RF模型可以获得非常好的效果。建模的数据是真实世界的数据。它们都使用...
这些结果完全合理!随机森林是一种比决策树更强大的算法,因为它基本上是DT的集合。当涉及到对看不见的数据进行泛化时,集成(由更多模型组成的组合)在机器学习中非常强大。在决策树或SVM过度拟合的地方,随机森林通常表现相对较好,因为在内部,许多看到所有不同功能集的DT对结果投了票。