我正在分析风力涡轮机参数如何影响风速。数据集来自:https://datadryad.org/stash/dataset/doi:10.5061/dryad.vx0k6djxg
mod4= lm(wind_speed~turbine_distance* rotor_size *tower_height+
turbine_operation_bin+number_turbines, data = d2)
逐步删除后,这是总结输出
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.089e+00 1.943e+00 4.164 3.16e-05 ***
rotor_size -1.117e-01 1.780e-02 -6.274 3.67e-10 ***
tower_height -1.565e-02 1.005e-02 -1.557 0.12
turbine_operation_binTRUE 5.126e-01 1.264e-02 40.558 < 2e-16 ***
number_turbines 7.961e-02 5.357e-03 14.860 < 2e-16 ***
rotor_size:tower_height 3.962e-04 9.111e-05 4.348 1.39e-05 ***
rotor_size 每增加 1m,距地面 10m 处的风速减少 -1.117e-01 ± 1.780e-02 m/s (p=3.67e-10),并且减少幅度为 3.962e-04 ± 9.111塔高每增加 1m,e-05 m/s (p= 1.39e-05)
tower_height 是一个连续变量,但我尝试将其分为短和高(较低 50% -> 矮,较高 50% -> 高)
d3 <- d2 %>% mutate(tower_height = case_when(tower_height<-floor(0.5*(nrow(d2))) ~'short',tower_height<-ceiling(0.5*(nrow(d2)))~'tall')
d3$tower_height = as.factor(d3$tower_height)
mod5= lm(wind_speed~turbine_distance*rotor_size*tower_height+
turbine_operation_bin+number_turbines, data = d3)
summary(mod5)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.216e+00 2.985e-01 7.424 1.24e-13 ***
turbine_distance 9.164e-04 1.113e-03 0.823 0.41042
rotor_size -7.813e-03 2.825e-03 -2.766 0.00568 **
tower_heighttall 4.095e+00 4.660e-01 8.787 < 2e-16 ***
turbine_operation_binTRUE 5.631e-01 1.282e-02 43.941 < 2e-16 ***
number_turbines 6.409e-02 5.421e-03 11.822 < 2e-16 ***
turbine_distance:rotor_size -1.009e-05 1.045e-05 -0.966 0.33416
turbine_distance:tower_heighttall -2.294e-03 1.743e-03 -1.317 0.18804
rotor_size:tower_heighttall -3.459e-02 4.095e-03 -8.445 < 2e-16 ***
turbine_distance:rotor_size:tower_heighttall 2.196e-05 1.533e-05 1.433 0.15185
ggplot(data=d3, aes(x=rotor_size, y=wind_speed)) + geom_point(aes(colour=tower_height)) + geom_smooth(method=lm, aes(colour=tower_height))
结果图显示,随着 tower_height 的增加,wind_speed 下降的速度更快。但汇总输出表明,随着 tower_height 的增加,下降幅度减小。我不知道出了什么问题,也不知道是否在我的演示文稿中使用该图。
“sjPlot”包中的 plot_model() 函数还提供了绘制各种模型类型的工具,包括 lm(er) 模型。
我对风了解不多,但从你的图表来看,rotor_size 和 tower_height 是相关的。使用这些预测变量之一(连续)并检查非线性效应是否没有意义?
如果没有,我仍然建议使用与 50% 不同的标准来分类 tower_height,因为几乎重叠的值目前似乎分配给高/短 tower_height。
希望这有帮助!