随机森林模型：如何在 R 中显示与目标变量显着相关的变量的 p 值

问题描述投票：0回答：0

我在 R 中为 48 个变量的数据集制作了一个简单的分类随机森林模型。我对数据建模还很陌生。我生成了基尼杂质指数和 MDA 指标来确定对模型重要的重要变量，但我找不到直接的方法来获取这些关联的 p 值。是否有一个包或代码可以查找与我的目标变量与 p 值显着相关的变量？

我遇到了 randomForestExplainer 包，它有一个measure_importance函数，其p值用于衡量变量是否会导致节点分裂的重要性。我认为我的问题的本质是通过该函数的指标（MDA、基尼等）测量的随机森林中的节点影响是否表明该变量与目标变量显着相关。