如何解释带有记录的 DV 的回归表?

问题描述 投票:0回答:1

我正在写一篇研究论文,并使用 R 进行定量分析。我正在使用 OLS 回归,并且需要对因变量执行对数转换以实现线性,但是我不再理解我的回归表,希望有人可以帮助我解释它。

为了运行对数回归,我需要使用此代码过滤零,这也可以解释为什么我的结果看起来不同以及日志的效果: Code to get rid of zeros

如果没有日志,它以前看起来像这样: Pre-log regression table

回归后,它看起来像这样: Post-log regression

r regression linear-regression logarithm
1个回答
0
投票

非常好的分析,感谢分享。

几点建议:

  • 为了使两份报告中的报告具有可比性,请过滤零利润/税收/营业额。目前,您仅将此过滤器应用于
    log
    型号。
  • 另一种选择是不做
    log(tax)
    而是做
    log(tax+1)
    。在这种情况下,
    tax=0
    将映射到
    log(1+0) = 0
    。这将允许一起使用所有数据点。这会影响模型的准确性。

返回您的报告。您有一个相当短的表格(与标准回归报告相比),您可以从中分析模型的质量和变量的重要性。

  • 首先看
    Adjusted R2
    。 R2 越高,模型越好。 R2 显示由因子解释的因变量的百分比。例如,44.5%的对数税收模型是由因素解释的。综上所述,
    log
    模型显示出更高的预测能力。但当然,这可能是因为您已经过滤了部分数据集来构建日志模型。
  • 然后您可以检查哪些系数变为零。例如,
    Num Employees
    是预测
    tax
    的重要因素(三颗星非零),并且在
    log tax
    模型中为零。这里你应该使用专家的意见来决定哪个模型显示真实的关系,即员工数量是否影响利润等等。
  • 您还可以注意因素的符号。例如,在
    tax
    模型中,
    Num Employees
    系数为
    -14.347
    。这意味着
    Num Employees
    对税收有负面影响,即你拥有的员工越多,税收就越低
  • 最后你应该注意每个系数附近的星星。三颗星意味着系数对于模型很重要,如果排除这些系数,模型将会变弱。没有开始的系数称为
    insignificant
    。这些系数可以从模型中排除,而 R2(预测精度)不会显着下降。或者更简单地说,我们不确定它们不是零。是的,在表中您可能会看到非零值,但实际上效果很可能为零。通常您需要更多数据来更加确定这些因素。例如,让我们检查log-tax模型中的
    EM 2022
    ,系数是
    -13.998
    ,虽然这是一个很大的值,但没有星星,因此微不足道。因此,仍然有很高的概率为零,这意味着 EM 2022 因子不会影响对数税。在这种情况下,你不能说
    EM 2022
    log-tax
    有负面影响,你说影响是负面的,但微不足道,因此我们不能依赖这种负面关系。
© www.soinside.com 2019 - 2024. All rights reserved.