我已经看到了这个问题的一些变体,但是它们似乎并没有具体回答我要完成的任务。我有一个数据框(df
):
month ter dist emp_count var1 var2
1 1 10 21 3000 5120
2 1 10 20 3100 5340
3 1 10 20 3100 5543
4 1 10 21 3250 5625
5 1 10 24 3200 5254
6 1 10 25 3300 5634
7 1 10 26 3600 5435
8 1 10 26 3900 7546
. . . . . .
. . . . . .
. . . . . .
[ter
拥有值1、2、3或4。并且dist
可以是1到50的任意数字。我想基于ter
或dist
]多次做一次简单的回归运算>
我有这个:
model = lm(var1 ~ emp_count, data = df) summary(model)
但是如果我想基于
dist
进行比较,我宁愿不写50次回归。
我已经看到了这个问题的一些变体,但是它们似乎并没有具体回答我要完成的任务。我有一个数据帧(df):month ter dist emp_count var1 var2 1 ...
按您的迭代次数或距离划分,然后应用您的健康状况和摘要
其他解决方案可以使用dplyr
和broom
软件包来完成。这是您的示例代码。首先,您需要提取每个线性模型(lm)的截距和斜率的系数和p值,并按变量dist分组。 tidy
类似于用于summary
的summary(lm)
功能。
如果只需要系数和p值,则可以使用nlme或lme4中的lmList: