我应该如何形象化我的解释?

问题描述 投票:0回答:1

我正在分析风力涡轮机参数如何影响风速。数据集来自:https://datadryad.org/stash/dataset/doi:10.5061/dryad.vx0k6djxg

mod4= lm(wind_speed~turbine_distance* rotor_size *tower_height+ 
           turbine_operation_bin+number_turbines, data = d2)

逐步删除后,这是总结输出

                           Estimate Std. Error t value Pr(>|t|)
(Intercept)                8.089e+00  1.943e+00   4.164 3.16e-05 ***
rotor_size                -1.117e-01  1.780e-02  -6.274 3.67e-10 ***
tower_height              -1.565e-02  1.005e-02  -1.557     0.12    
turbine_operation_binTRUE  5.126e-01  1.264e-02  40.558  < 2e-16 ***
number_turbines            7.961e-02  5.357e-03  14.860  < 2e-16 ***
rotor_size:tower_height    3.962e-04  9.111e-05   4.348 1.39e-05 ***

rotor_size 每增加 1m,距地面 10m 处的风速减少 -1.117e-01 ± 1.780e-02 m/s (p=3.67e-10),并且减少幅度为 3.962e-04 ± 9.111塔高每增加 1m,e-05 m/s (p= 1.39e-05)

tower_height 是一个连续变量,但我尝试将其分为短和高(较低 50% -> 矮,较高 50% -> 高)

d3 <- d2 %>% mutate(tower_height = case_when(tower_height<-floor(0.5*(nrow(d2))) ~'short',tower_height<-ceiling(0.5*(nrow(d2)))~'tall')
d3$tower_height = as.factor(d3$tower_height)
mod5= lm(wind_speed~turbine_distance*rotor_size*tower_height+ 
           turbine_operation_bin+number_turbines, data = d3)
summary(mod5)
Coefficients:
                                               Estimate Std. Error t value Pr(>|t|)    
(Intercept)                                   2.216e+00  2.985e-01   7.424 1.24e-13 ***
turbine_distance                              9.164e-04  1.113e-03   0.823  0.41042    
rotor_size                                   -7.813e-03  2.825e-03  -2.766  0.00568 ** 
tower_heighttall                              4.095e+00  4.660e-01   8.787  < 2e-16 ***
turbine_operation_binTRUE                     5.631e-01  1.282e-02  43.941  < 2e-16 ***
number_turbines                               6.409e-02  5.421e-03  11.822  < 2e-16 ***
turbine_distance:rotor_size                  -1.009e-05  1.045e-05  -0.966  0.33416    
turbine_distance:tower_heighttall            -2.294e-03  1.743e-03  -1.317  0.18804    
rotor_size:tower_heighttall                  -3.459e-02  4.095e-03  -8.445  < 2e-16 ***
turbine_distance:rotor_size:tower_heighttall  2.196e-05  1.533e-05   1.433  0.15185
    
ggplot(data=d3, aes(x=rotor_size, y=wind_speed)) + geom_point(aes(colour=tower_height)) + geom_smooth(method=lm, aes(colour=tower_height))

结果图显示,随着 tower_height 的增加,wind_speed 下降的速度更快。但汇总输出表明,随着 tower_height 的增加,下降幅度减小。我不知道出了什么问题,也不知道是否在我的演示文稿中使用该图。 interpretation graph

r ggplot2 lm
1个回答
0
投票

“sjPlot”包中的 plot_model() 函数还提供了绘制各种模型类型的工具,包括 lm(er) 模型。

我对风了解不多,但从你的图表来看,rotor_size 和 tower_height 是相关的。使用这些预测变量之一(连续)并检查非线性效应是否没有意义?

如果没有,我仍然建议使用与 50% 不同的标准来分类 tower_height,因为几乎重叠的值目前似乎分配给高/短 tower_height。

希望这有帮助!

© www.soinside.com 2019 - 2024. All rights reserved.