我在 R 中遇到了这个问题。 我正在尝试进行回归。第一个变量是分类变量,我将其称为 DistanceGroup。距离组有 4 个不同的值 - 0、1、2、3。每个观察结果都属于这四个类别之一。
回归的目的是看DistanceGroup对变量HSGradRate(高中毕业率)的影响,但我想为变量“PovertyRate”添加一个控制,即贫困率(它是一个连续变量,从0.1 至 26.9)。
到目前为止我尝试过运行以下代码
`HSGradModel <- lm(HSGradRate ~ DistanceGroup + PovertyRate, data = df)`
我的问题是输出是这样的:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.613e-01 1.246e-02 12.948 < 2e-16 ***
DistanceGroup 1.487e-02 6.203e-04 23.972 < 2e-16 ***
PovertyRate0.1 -6.315e-02 3.240e-02 -1.949 0.051306 .
PovertyRate0.2 -5.521e-02 2.205e-02 -2.504 0.012280 *
PovertyRate0.3 -4.359e-02 2.025e-02 -2.152 0.031398 *
PovertyRate0.4 -2.197e-02 2.044e-02 -1.075 0.282461
.
.
.
PovertyRate26.9 1.372e-01 1.559e-02 8.798 < 2e-16 ***
我希望 PovertyRate 只是多元回归中的 1 个变量,我不希望它被视为分类变量。我有什么办法可以做到这一点吗?
正如 neilfsw 所指出的,你的因变量不是数值型的。所以要么改造它:
df$HSGradRate <- as.numeric(df$HSGradRate)
或者简单地做
lm(as.numeric(HSGradRate) ~ DistanceGroup + PovertyRate, data = df)