我是一名 R 资深人士,通常讨厌使用嵌套列表,因为它们看起来很棘手......但我不确定我可以在这里避免使用它们。在这种情况下,我可以生成我想要的输出,但我不知道如何智能地拆分列表。
我正在尝试从数据集中为类的每个级别创建 n 个线性模型。运行所有模型后,我想要一个简单的表格,其中包含每个级别的斜率、截距和类别。下面的例子就是我想要的:
# Dummy data
d <- data.frame(x=rnorm(50, 10, 1),
y=rnorm(50, 0, 2),
class=c(rep('A',10),rep('B',10),rep('C',10),rep('D',10),rep('E',10)))
# Split the data by grouping variable
d.s <- split(d, d$class)
# Create a linear model from y~x in each class
coeffs <- function(df) {
m <- lm(y~x, data = df)$coefficients
}
m.s <- lapply(d.s, coeffs)
# How do I neatly get a data frame that looks like below out of m.s??
wanted <- data.frame(class=as.character(), slope=as.numeric(), intercept=as.numeric())
请原谅我对嵌套列表的厌恶和缺乏经验!经过多行取消列出并拆开行名后,我可以获得我想要的东西,但必须有更好的方法。我正在努力改变...
用
data.frame
和 names
数据制作 rbind
。
> data.frame(class=names(m.s), do.call('rbind', m.s)) |>
+ setNames(c('class', 'intercept', 'slope'))
class intercept slope
A A 9.4390072 -0.8430022
B B -5.2018384 0.4988027
C C -7.9531678 0.8298487
D D -0.9505984 0.1192621
E E -1.8155237 0.1522270