我正在尝试编写一个函数来为数据集中的变量运行所有可能的回归模型。我能够运行每个变量,这是我到目前为止所拥有的。
library(tidyverse)
library(broom)
data("mtcars")
model1 <- function (DATA) {
DATA %>%
map(~lm(mpg ~ .x, data = DATA), tidy)%>% map(summary) %>%
map_dbl("adj.r.squared") %>%
tidy %>%
rename(adj.r.squared = x)
}
model1(mtcars)
我是R和编写函数的新手,所以我确定它存在一些问题。我希望为所有可能的模型提供所有调整后的r平方值的详细信息。如何编写对两个,三个或更多个变量执行相同操作的函数?
我不知道有任何软件包可以使它自动化。因此,让我们尝试一下蛮力方法。这个想法是手工生成所有可能的组合并对其进行迭代。
vars <- names(mtcars)[-1]
models <- list()
for (i in 1:5){
vc <- combn(vars,i)
for (j in 1:ncol(vc)){
model <- as.formula(paste0("mpg ~", paste0(vc[,j], collapse = "+")))
models <- c(models, model)
}
}
您可以使用这些公式来运行线性模型。
lapply(models, function(x) lm(x, data = mtcars))