我目前正在做一个项目,试图寻找人类活动与全球变暖之间因果关系的证据。在对两个变量求差并检查单位根后,我一直试图对全球温度的年排放量进行格兰杰因果关系测试。
test = pd.DataFrame({'temp':temperature,'emissions':emissions)
sm.tsa.stattools.grangercausalitytests(test,30)
有人可以帮助我更清楚给出的输出吗?
滞后11和14的样本输出:
Granger Causality
number of lags (no zero) 11
ssr based F test: F=1.1019 , p=0.3716 , df_denom=76, df_num=11
ssr based chi2 test: chi2=15.7887 , p=0.1492 , df=11
likelihood ratio test: chi2=14.6493 , p=0.1991 , df=11
parameter F test: F=1.1019 , p=0.3716 , df_denom=76, df_num=11
...
number of lags (no zero) 14
ssr based F test: F=1.2862 , p=0.2394 , df_denom=67, df_num=14
ssr based chi2 test: chi2=25.8004 , p=0.0274 , df=14
likelihood ratio test: chi2=22.8514 , p=0.0627 , df=14
parameter F test: F=1.2862 , p=0.2394 , df_denom=67, df_num=14
什么时候卡方检验结果优于F检验?我的印象是,最好使用滞后数较高的卡方,但原始样本量很小(n = 100)。
如果测试的零假设不是格兰杰因果关系,那么我猜想在卡方检验下,在滞后14时,排放“危险导致”全球变暖达到95%CI?如果我错了,请纠正我。
格兰杰因果关系的证据非常薄弱。
样本量很小,基于渐近分布的chi2 Wald检验可能会导致拒绝率过高。在许多情况下,使用F分布具有更好的小样本属性,但我不知道对于Granger因果关系检验(即向量自回归设置中的Wald检验)是否也是如此。
此外,如果我们尝试几个不同的延迟,那么我们还会遇到多个测试问题。如果您运行许多测试,那么您可能会发现纯粹是随机的,如果p值未针对多次测试进行校正,则这很重要。