我有两个数据集data1和data2,它们具有相同的变量,但情况不同。 data1具有一个具有特定值的变量x。我想捕获data2变量x中的情况,其值与data1变量x值匹配。有什么具体办法吗?我知道我们可以为每个数据集选择具有个别值的个案,但是我不知道一种跨两个数据集进行处理的方法。
[方法是在data1
中创建一个新变量,该变量标记为X
中存在的data2
的值,然后像往常一样在data1
中进行操作:
dataset activate data2.
dataset declare xvals.
aggregate out=xvals /break = x/occursInData2=n.
dataset activate data1.
sort cases by X.
match files /file=*/table=xvals/by X.
[此时data1
将包含一个新变量occursInData2
,该变量仅在data2
中也出现X的情况下才具有一个值。