为什么与MatchIt R软件包进行精确匹配,找到具有2个不同级别的分类变量的匹配对?

问题描述 投票:0回答:1

我实际上正在处理金枪鱼标签捕获数据。我想在两组个人之间进行采样之间的平衡,即在参考区域中标记的人员(治疗组)和在该区域以外的标签的人(对照组)。为此,我使用了MatchIt包。

我有3个协变量:长度(每5厘米箱),标记月份(1月至12月)和标记金枪鱼的结构。

所以有型号:treatment ~ length + month + structure

[最后一个变量,是一个分类变量,具有从A到E的5个等级。等级A几乎仅在治疗组中代表(对照组为6000个结构= A的个体,而对照组为300个结构= A的个体) 。

我首先使用最近邻法,但是平衡方面的改进并不令人满意。因此,我使用了精确且粗略的精确匹配方法。

尽管该精确方法应该为每个协变量匹配具有相同值的对。但是在输出的匹配数据中,治疗组中仍然有超过3000个结构= A的个体。

你们有一个解释吗?我红了很多,但没有找到答案。

谢谢

r categorical-data exact-match propensity-score-matching
1个回答
0
投票

精确匹配和粗化精确匹配不执行1:1匹配。他们在对照组中找到与治疗组中的每个成员完全匹配的所有成员。子类是基于预测值的每种组合形成的,保留了既有已处理单元又有控制单元的任何子类,其他子类则被丢弃。没有配对发生。您的结果表明,您有许多控制单元与某些处理单元具有相同的协变量值(在CEM情况下几乎相同)。

© www.soinside.com 2019 - 2024. All rights reserved.