在R中多次插入后计算预测均值(或预测概率)和SE

问题描述 投票:3回答:1

我想计算预测值和标准误差,但是我不能简单地使用predict(),因为我使用的是15个乘法估算数据集(生成的Amelia程序包)。我在每个数据集上运行回归模型。然后,使用Amelia函数mi.meld()(使用鲁宾法则)将结果组合为一组模型系数和标准误差。

示例数据和代码:

dd<-list()
for (i in 1:15){
dd[[i]] <- data.frame(
  Age=runif(50,20,90),
  Cat=factor(sample(0:4, 50, replace=T)),
  Outcome = sample(0:1, 50, replace=T)
)}

b.out<-NULL
se.out<-NULL
for(i in 1:15) {
  ols.out<-glm(Outcome~Age+factor(Cat), data=dd[[i]],family="binomial")
  b.out <- rbind(b.out, ols.out$coef)
  se.out <- rbind(se.out, coef(summary(ols.out))[,2])}
mod0 <- mi.meld(q = b.out, se = se.out)

> mod0
$q.mi
     (Intercept)         Age factor(Cat)1 factor(Cat)2 factor(Cat)3 factor(Cat)4
[1,]   0.0466825 -0.00577106    0.5291908  -0.09760264    0.4058684    0.3125109

$se.mi
     (Intercept)        Age factor(Cat)1 factor(Cat)2 factor(Cat)3 
factor(Cat)4
[1,]    1.863276 0.02596468     1.604759     1.398322     1.414589     
1.332743

现在是有问题的部分。我想为以下一组预测值计算预测值(在这种情况下为预测概率)和标准误差:

data.predict <- data.frame(Cat=as.factor(c(0:4)), Age=53.6)
print(data.predict)
  Cat  Age
1   0 53.6
2   1 53.6
3   2 53.6
4   3 53.6
5   4 53.6

如果我在1个数据集上拟合了一个模型,则只需这样做:

prediction<- predict(mod1, data.predict, type="response",se.fit=T)

但是,我没有模型对象,只存储了系数。现在,我研究了解决此问题的两种方法,第一种是通过这种方式手动计算预测:predict() with arbitrary coefficients in r但是我不知道如何解决标准错误。.我的另一个想法是创建一个伪造的模型对象,例如该函数创建:https://gist.github.com/MrFlick/ae299d8f3760f02de6bf并将其用于predict(),但作为标准错误没有使用该模型的模型,也没有办法计算预测的标准误差。]]

有人对如何解决这个问题有建议吗?我试图用示例代码清楚地解释我的问题,但是如果我的问题不清楚,请告诉我,以便我提供其他信息。谢谢您的帮助!

我想计算预测值和标准误差,但是我不能简单地使用预报(),因为我正在使用15个乘法估算数据集(生成的Amelia程序包)。我在每个...上运行回归模型...

r regression predict imputation
1个回答
0
投票

我确定您将在近几年后不需要这个答案,但是我只是在研究类似的问题,我想我将答案放在这里供后代参考。

[安德鲁·海斯(Andrew Heiss)在此将解决方案放在gisthub上-https://gist.github.com/andrewheiss/a3134085e92c6607db39c5b14e1b879e

© www.soinside.com 2019 - 2024. All rights reserved.