我对机器学习算法的可解释性有疑问。
我的数据集看起来像这样:tabular data set
我已经训练了一个分类模型(来自Scikit-Learn的MLPClassifier),并想知道哪些特征对决策有最大影响(最高权重)。
我的最终目标是找到具有高概率(> 90%)的不同解决方案(特征组合)归类为1。
有人知道获得这些解决方案的方法吗?
提前致谢!
为了在分类任务期间获得特征重要性,分类方法必须是随机森林或决策树,两者都在sklearn中实现,
clf = RandomForestClassifier(n_estimators=100, max_depth=2,random_state=0)
clf.fit(X, y)
#After the fit step
clf.feature_importances_
功能重要性将告诉您每个功能的重量,如果您的MLP分类器经过适当的培训,它将为您的网络中的各种功能分配几乎相似的重要性,