多元线性回归 - 如何在这里检验假设?

问题描述 投票:0回答:1

enter image description here

我有一个数字因变量(学校的药物报告),其中包含三个二元分类预测变量 - 学校是否接受药物培训、学校是否接受纪律培训以及学校的干预实践数量是多还是少。我已经制作了所有这些因子变量,现在我正在努力测试我的回归分析的假设。为什么散点图显示垂直线?我需要更改我的 Rcode 吗?我已附上以下所有内容,任何帮助都会很棒!

仅供参考,我的因变量(药物)有一个偏态分布,所以我做了对数转换。

model <- lm(log_drug ~ practice_hilo + alcohol_drugabuse_f + discipline_policies_f, data = school_safety)
summary(model)
Call:
lm(formula = log_drug ~ practice_hilo + alcohol_drugabuse_f +
discipline_policies_f, data = school_safety)
Residuals:
Min 1Q Median 3Q Max
-1.864 -1.079 -0.273 1.062 4.014
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.37159 0.06750 20.320 <2e-16 ***
practice_hiloLow Value -0.51009 0.05397 -9.451 <2e-16 ***
alcohol_drugabuse_fYes 0.49221 0.05727 8.594 <2e-16 ***
discipline_policies_fYes -0.09211 0.06485 -1.420 0.156
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.323 on 2720 degrees of freedom
Multiple R-squared: 0.07806, Adjusted R-squared: 0.07704
F-statistic: 76.76 on 3 and 2720 DF, p-value: < 2.2e-16

不知道为什么我的模型显示垂直线。除了线性回归之外,我还没有学习过任何其他类型的回归,所以我想尝试使其与我的数据一起工作。

r regression
1个回答
0
投票

您的散点图是正确的。您看到垂直线是因为观察的杠杆作用只能有 8 个不同的值。为什么?杠杆取决于每个观察的自变量的值。1 如果两个观察的自变量具有相同的值,则它们将具有相同的杠杆。由于三个自变量具有两个不同的可能值(0 或 1),因此自变量值有 23 = 8 种可能的不同组合,因此只有 8 种可能的不同杠杆值。具有相同杠杆的观察结果显示为垂直线。


1杠杆定义为 xiT(XTX)-1xi ,其中 X 是设计矩阵(包含所有数据的矩阵,在该公式中对于每个观测值都是相同的),并且 xi 是包含观测值 i 的自变量值的向量。您可以看到,由于 X 对于所有观测值都是相同的,那么如果 xi 也相同,则杠杆将相同。

© www.soinside.com 2019 - 2024. All rights reserved.