我正在写一篇研究论文,并使用 R 进行定量分析。我正在使用 OLS 回归,并且需要对因变量执行对数转换以实现线性,但是我不再理解我的回归表,希望有人可以帮助我解释它。
非常好的分析,感谢分享。
几点建议:
log
型号。log(tax)
而是做 log(tax+1)
。在这种情况下,tax=0
将映射到log(1+0) = 0
。这将允许一起使用所有数据点。这会影响模型的准确性。返回您的报告。您有一个相当短的表格(与标准回归报告相比),您可以从中分析模型的质量和变量的重要性。
Adjusted R2
。 R2 越高,模型越好。 R2 显示由因子解释的因变量的百分比。例如,44.5%的对数税收模型是由因素解释的。综上所述,log
模型显示出更高的预测能力。但当然,这可能是因为您已经过滤了部分数据集来构建日志模型。Num Employees
是预测 tax
的重要因素(三颗星非零),并且在 log tax
模型中为零。这里你应该使用专家的意见来决定哪个模型显示真实的关系,即员工数量是否影响利润等等。tax
模型中,Num Employees
系数为 -14.347
。这意味着Num Employees
对税收有负面影响,即你拥有的员工越多,税收就越低insignificant
。这些系数可以从模型中排除,而 R2(预测精度)不会显着下降。或者更简单地说,我们不确定它们不是零。是的,在表中您可能会看到非零值,但实际上效果很可能为零。通常您需要更多数据来更加确定这些因素。例如,让我们检查log-tax模型中的EM 2022
,系数是-13.998
,虽然这是一个很大的值,但没有星星,因此微不足道。因此,仍然有很高的概率为零,这意味着 EM 2022 因子不会影响对数税。在这种情况下,你不能说 EM 2022
对 log-tax
有负面影响,你说影响是负面的,但微不足道,因此我们不能依赖这种负面关系。