如何用 R 中的分类变量解决这个问题?

问题描述 投票:0回答:1

我在 R 中遇到了这个问题。 我正在尝试进行回归。第一个变量是分类变量,我将其称为 DistanceGroup。距离组有 4 个不同的值 - 0、1、2、3。每个观察结果都属于这四个类别之一。

回归的目的是看DistanceGroup对变量HSGradRate(高中毕业率)的影响,但我想为变量“PovertyRate”添加一个控制,即贫困率(它是一个连续变量,从0.1 至 26.9)。

到目前为止我尝试过运行以下代码

`HSGradModel  <- lm(HSGradRate ~ DistanceGroup + PovertyRate, data = df)`

我的问题是输出是这样的:

Coefficients:
                  Estimate  Std. Error  t value   Pr(>|t|)    
(Intercept)      1.613e-01   1.246e-02   12.948    < 2e-16 ***
DistanceGroup    1.487e-02   6.203e-04   23.972    < 2e-16 ***
PovertyRate0.1  -6.315e-02   3.240e-02   -1.949   0.051306 .  
PovertyRate0.2  -5.521e-02   2.205e-02   -2.504   0.012280 *  
PovertyRate0.3  -4.359e-02   2.025e-02   -2.152   0.031398 *  
PovertyRate0.4  -2.197e-02   2.044e-02   -1.075   0.282461   
.
.
.
PovertyRate26.9 1.372e-01    1.559e-02    8.798   < 2e-16 ***

我希望 PovertyRate 只是多元回归中的 1 个变量,我不希望它被视为分类变量。我有什么办法可以做到这一点吗?

r regression linear-regression
1个回答
0
投票

正如 neilfsw 所指出的,你的因变量不是数值型的。所以要么改造它:

df$HSGradRate <- as.numeric(df$HSGradRate)

或者简单地做

lm(as.numeric(HSGradRate) ~ DistanceGroup + PovertyRate, data = df)

© www.soinside.com 2019 - 2024. All rights reserved.