如何在摘要(lm)中解释转换后的独立变量和因变量?

问题描述 投票:0回答:1
Call:                   
lm(formula = GROWTH ~ log(X1) + log(X2) + log(X3) + log(X4) +                   
    log(X5) + log(1 +X6) + log(1 + X7) +                    
    log(X8) + log(X9) + log(X10) + log(X11) +                   
    log(X12) + log(X13) + X14 + X14:X9 +                    
    X14:X10                 
    data = Data)                    

Residuals:                  
Min 1Q  Median  3Q  Max 
-3.04237    -0.31965    0.05351 0.36639 2.52087 

Coefficients:                   
                    Estimate    Std. Error  t value Pr(>|t|)    
(Intercept)         2.837487    9.543146    0.297   0.766217    
log(X1)             0.377957    0.008647    43.71   < 2e-16 ***
log(X2)             0.363631    0.008906    40.829  < 2e-16 ***
log(X3)             0.337246    0.024202    13.934  < 2e-16 ***
log(X4)            -0.19371     0.029786   -6.503   8.11E-11    ***
log(X5)             0.01227     0.00437     2.808   0.004995    **
log(1 + X6)         0.006533    0.036977    0.177   0.859759    
log(1 + X7)         0.426738    0.191617    2.227   0.02596 *
log(X8)            -0.020741    0.009424    -2.201  0.027759    *
log(X9)             11.303514   2.745818    -4.117  3.87E-05    ***
log(X10)           -7.466939    0.814056    -9.173  < 2e-16 ***
log(X11)           -0.004444    0.00885    -0.502   0.615567    
log(X13)            0.067205    0.010626    6.325   2.61E-10    ***
log(X12)            1.711401    0.580518    2.948   0.003203    **
X14 [LEVEL 1]       18.422627   9.391444    -1.962  0.049823    *
X14 [LEVEL 2]       20.160172   9.386903    -2.148  0.031755    *
X14 [LEVEL 3]       12.78601    15.33008    0.834   0.404268    
X14 [LEVEL 4]       19.937816   9.679742    -2.06   0.03944 *
X14 [LEVEL 5]       13.83603    10.916449   -1.267  0.205015    
X14 [LEVEL 6]       23.939136   9.47908     -2.525  0.011565    *
X14 [LEVEL 7]       20.220041   11.217758  -1.803   0.071487    .
X14 [LEVEL 8]:X9    6.652888    4.17066     1.595   0.110697    
X14 [LEVEL 1]:X9    7.560706    1.981892    3.815   0.000137    ***
X14 [LEVEL 2]:X9    8.124572    1.857204    4.375   1.22E-05    ***
X14 [LEVEL 3]:X9    0.765371    5.173577    0.148   0.882393    
X14 [LEVEL 4]:X9    8.415016    2.337441    3.6 0.000319    ***
X14 [LEVEL 5]:X9    8.760546    3.293728    2.66    0.007828    **
X14 [LEVEL 6]:X9    10.727086   1.950529    5.5 3.87E-08    ***
X14 [LEVEL 7]:X9    8.913338    3.62592 2.458   0.013974    *
X14 [LEVEL 8]:X10   -9.409351   6.665734    -1.412  0.158089    
X14 [LEVEL 1]:X10   5.600412    0.628323    8.913   < 2e-16 ***
X14 [LEVEL 2]:X10   6.308849    0.669047    9.43    < 2e-16 ***
X14 [LEVEL 3]:X10   12.890973   5.191096    -2.483  0.013029    *
X14 [LEVEL 4]:X10   6.008453    0.835861    7.188   6.88E-13    ***
X14 [LEVEL 5]:X10   -0.174229   2.401866    -0.073  0.942174    
X14 [LEVEL 6]:X10   6.335575    0.774041    8.185   2.95E-16    ***
X14 [LEVEL 7]:X10   5.391272    2.226843    2.421   0.015488    *
---                 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1                  

Residual standard error: 0.563 on 14573 degrees of freedom                  
(31913 observations deleted due to missingness)                 
Multiple R-squared:  0.5652                 
"   Adjusted R-squared:  0.5642 "                   
F-statistic: 526.3 on 36 and 14573 DF                   
p-value: < 2.2e-16**    

以上是线性GROWTH模型。为了隐私目的,我已在自变量'标签'中替换。在该示例中,所有数值变量都已进行对数变换,并且从属增长变量已应用了框cox变换。在独立的情况下,这样做是为了归一化输入变量,并且箱子cox变换被应用于从属以校正输出中的增加的方差。虽然我当然是R的新手,但我相信这比没有变换的数据更合适。但是,如果我不在这里,请告诉我。现在,我的问题是,我如何解释这些价值观?有没有办法'un'transform输出,所以系数估计和标准误差对我有价值?他们目前的状态很少。

r transformation lm summary natural-logarithm
1个回答
0
投票

首先,取消转换日志的方法是采取相反的方法。有许多不同类型的日志,其中最常见的是自然日志(看起来这就是你所使用的) - 在这种情况下,你将采用你的变量(x)的自然指数;

EXP(x)的

一个很好的例子就是记录一个数字和exp

> log(58)
[1] 4.060443
> exp(4.060443)
[1] 58

这就是你的标题看起来像

variables estimates estimates_inverse std_error std_error_inverse
<chr>         <dbl>             <dbl>     <dbl>             <dbl>
1 Intercept    2.84              17.1     9.54             13949   
2 log(x1)      0.378              1.46    0.00865              1.01
3 log(x2)      0.364              1.44    0.00891              1.01
4 log(x3)      0.337              1.40    0.0242               1.02
5 log(x4)     -0.194              0.824   0.0298               1.03
6 log(x5)      0.0123             1.01    0.00437              1.00

此外,如果您正常化,则应在记录之前检查每个变量。确保它需要规范化 - 尝试不同的规范化方法(我最喜欢的是z得分归一化;

(变量 - 均值(变量))/(sd(变量))

还有一个能够很好地完成工作的规模

规模()

使用这些不同的方法并观察R ^ 2和P值

希望这有帮助!

© www.soinside.com 2019 - 2024. All rights reserved.