我怎么能retrive其影响结果Python中的数据集的属性

问题描述 投票:-2回答:2

我是一个初学者。我做的GPA的预测。我的数据集有这样的学生,学习时间,父母的职业,他们的成绩,母亲职业的旅行时间变量我etc.how可以检索其影响学生的GPA的属性?我的数据既有绝对的和离散值。

python machine-learning prediction feature-selection
2个回答
0
投票

你可以在Python中使用RandomForestRegressor在您的火车的数据拟合模型。然后你可以使用feature_importance_功能找到每个功能的重要性。如果您有兴趣模型的解释力,那么你也可以使用该功能treeinterpreter从包装treeinterpreter。这里有两个链接(link1link2),其中提供了treeinterpreter更深入的了解。


-1
投票

据我从你的问题明白了,你想知道哪些功能有过一个学生的GPA最终更大的影响力,是正确的?如果是这种情况,一些机器学习算法有这样的内置功能,让你的每个功能在模型中使用(系数)的功能重要性。例如,如果您使用的是逻辑回归,它有一个名为coef_功能,这将导致所使用的全部特征系数。有关coef_更多的信息可以发现here。具有这种内置功能的另一种算法是随机森林。此算法包含产生大小n_features阵列的函数调用feature_importance_。一般来说,功能重要度(高,更重要的功能)。有关feature_importance_功能的更多信息,可以发现here

© www.soinside.com 2019 - 2024. All rights reserved.