我在 R 中为 48 个变量的数据集制作了一个简单的分类随机森林模型。我对数据建模还很陌生。我生成了基尼杂质指数和 MDA 指标来确定对模型重要的重要变量,但我找不到直接的方法来获取这些关联的 p 值。是否有一个包或代码可以查找与我的目标变量与 p 值显着相关的变量?
我遇到了 randomForestExplainer 包,它有一个measure_importance函数,其p值用于衡量变量是否会导致节点分裂的重要性。我认为我的问题的本质是通过该函数的指标(MDA、基尼等)测量的随机森林中的节点影响是否表明该变量与目标变量显着相关。