我有一个时间序列数据集。对于每个日期,我应该有以下内容:
类别 | 子类别 | 价值 |
---|---|---|
A | A1 | 1 |
A | A2 | 2 |
乙 | B1 | 3 |
乙 | B2 | 4 |
但是,我确实有时会缺失值,例如:
类别 | 子类别 | 价值 |
---|---|---|
A | A1 | 1 |
乙 | B2 | 4 |
我想做的是确定每个日期的缺失值。所以有了上面的,它会是:
类别 | 子类别 | 价值 |
---|---|---|
A | A1 | 1 |
A | A2 | 空 |
乙 | B1 | 空 |
乙 | B2 | 4 |
为此,我在 Snowflake 中创建了一个这样的表,称为
scaffold
:
类别 | 子类别 |
---|---|
A | A1 |
A | A2 |
乙 | B1 |
乙 | B2 |
我写了以下查询:
select
a.date
,b.category
,b.subcategory
,a.value
from main_table a
right outer join scaffold b
on a.category=b.category
and a.subcategory=b.subcategory
奇怪的是,我的输出与下图一样——就好像我没有使用这个脚手架一样:
类别 | 子类别 | 价值 |
---|---|---|
A | A1 | 1 |
乙 | B2 | 4 |
我试过将连接更改为完全外部连接,但无济于事。任何帮助表示赞赏!