随机森林模型:如何在 R 中显示与目标变量显着相关的变量的 p 值

问题描述 投票:0回答:0

我在 R 中为 48 个变量的数据集制作了一个简单的分类随机森林模型。我对数据建模还很陌生。我生成了基尼杂质指数和 MDA 指标来确定对模型重要的重要变量,但我找不到直接的方法来获取这些关联的 p 值。是否有一个包或代码可以查找与我的目标变量与 p 值显着相关的变量?

我遇到了 randomForestExplainer 包,它有一个measure_importance函数,其p值用于衡量变量是否会导致节点分裂的重要性。我认为我的问题的本质是通过该函数的指标(MDA、基尼等)测量的随机森林中的节点影响是否表明该变量与目标变量显着相关。

r machine-learning random-forest correlation
© www.soinside.com 2019 - 2024. All rights reserved.