Power BI的最佳功能之一是能够识别最有助于趋势增加和减少的因素。据我了解,机器学习方法用于产生结果。更多信息:https://docs.microsoft.com/en-us/power-bi/desktop-insights
使用Python识别最有助于增加和减少数据集中趋势的因素的最佳方法是什么?
您的问题可能有许多可能的答案,因为您可以使用线性和非线性方法来探索自变量和目标变量之间的变化之间的依赖关系。具有高解释力的最简单方法之一是基于决策树分类器的python包scikit-learn中的函数.feature_importances_。一旦你有自变量X和目标y,syntaxis就很简单了:
forest = ExtraTreesClassifier(n_estimators=250,
random_state=0)
forest.fit(X, y)
importances = forest.feature_importances_
您可以在http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html查看更多详情