Random Forest的表现要比其他方法好得多

问题描述 投票:2回答:1

[在评估SVM,RF和DT的性能时(max_depth = 3),使用RF模型可以获得非常好的效果。建模的数据是真实世界的数据。由于数据集不平衡,因此它们均使用分层交叉验证进行评估。

对于之前见过的4个不同的类别,我得到了这些分数的准确性,回忆性和F1。

最初,数据集包含以下四个类别的以下values_counts:

  1. 进纸故障-(差异P设置/ P实际): 4098个数据样本
  2. 进纸故障-(进纸安全电路故障):
  3. 383个数据样本
  4. 发电机加热:
  5. 228 668个数据样本
  6. 其他:
  7. 51 966 851个样本

    RF如何比SVM和DT好得多?

谢谢!

enter image description here

enter image description here

[在评估SVM,RF和DT的性能时(max_depth = 3),使用RF模型可以获得非常好的效果。建模的数据是真实世界的数据。它们都使用...

python machine-learning scikit-learn svm
1个回答
0
投票

这些结果完全合理!随机森林是一种比决策树更强大的算法,因为它基本上是DT的集合。当涉及到对看不见的数据进行泛化时,集成(由更多模型组成的组合)在机器学习中非常强大。在决策树或SVM过度拟合的地方,随机森林通常表现相对较好,因为在内部,许多看到所有不同功能集的DT对结果投了票。

© www.soinside.com 2019 - 2024. All rights reserved.