Diff-in-Diff在相同位置具有不同的治疗时间

问题描述 投票:0回答:1

我正在尝试估算关闭燃煤电厂对空气质量的影响。我的数据是来自空气质量监测站的每月数据。我的处理站是最接近燃煤电厂的处理站,但是燃煤电厂的不同单位在不同月份关闭。例如,一个有4个单元的工厂,有2个单元在2010年10月关闭,另两个在2013年9月关闭。我正在寻找一种实验设计,以推断关闭对空气质量的因果关系。

我想知道以下说明是否正确:

enter image description here

其中P_ {it}是第i站在年月t中报告的污染物。 \alpha_{i}\lambda_{t}是电站和年份-月份的虚拟变量,并且D ^ {i} _ {t}是一个指标,该值等于最接近已关闭燃煤电厂的电站i的年份-月份t中的一个。在年月t中

两个问题:1)我能否仅在关闭月份(或关闭后三个月)内使D ^ {i} _ {t}等于1,而不是在关闭之后的所有期间都将D ^ {i} _ {t}等于1在此职位2的解决方案中建议)?只有在关闭后的短时间内将D保持为1时,污染的减少才有意义。

2)时间虚拟变量必须是year_month虚拟变量还是两个单独的虚拟变量(即,一个代表几个月,一个代表几年)?

regression estimation economics experimental-design causality
1个回答
0
投票

传统的Diff-n-Diff需要三个三个基本变量。一个变量是否属于治疗组(即,数据收集站点附近的工厂最终关闭)。如果此观察时间已超过工厂关闭日期,则为一个变量。在工厂关闭后的所有时间段内,此变量均为1。最后,一个将两者相乘的变量。

假设您有工厂A和B。工厂A将于2013年1月关闭。

您的数据看起来像

植物--------月-----处理-----处理-----处理后处理

A ----------- 12/2012 --------- 1 --------------- 0 ------- ------- 0

A ---------- 1/2013 ----------- 1 --------------- 1 ------ ------- 1

B --------- 12/2012 -------- 0 --------------- 0 ---------- ----- 0

B --------- 1/2013 ---------- 0 --------------- 1 -------- ------ 0

因此,对于传统的Diff-N-Diff,您的模型将是:

Outcome_i = B_0 + B_1*Treatment + B_2*Treated + B_3*TreatmentOnTreated + CONTROLS + Error

在这种情况下,TreatmentOnTreated将是您的关键变量。要回答有关是否只应在工厂关闭的月份将变量更改为1的问题,这不是最佳解决方案。如果仅当您盗用模型时才有意义,那么就不重要了。对此的唯一解释可能是,当一家燃煤电厂关闭时,污染减少了,但此后立即增加了。

在准差异-N-差异模型中,您有许多工厂在不同时间关闭,该模型将变为:

Outcome_i=B_0 + B_1*PlantClosed +B_p*PlantFixedEffects + B_n * Period Fixed Effects + CONTROLS + ERROR

这可以有效地测试与第一个模型相同的事物,但是它不那么干净。为了回答有关如何细分时间段的问题,如果您有足够的样本量来承受这么多的变量,我建议使每个时间段具有固定的影响。否则,您的调整后R平方将下降很多。

希望此帮助!如果您有任何疑问,请告诉我!

© www.soinside.com 2019 - 2024. All rights reserved.