我有一个包含ID,start_date和end_date列的表。
表格:
ID start_date end_date
1 01/01/2017 01/01/2018
1 01/01/2018 01/01/2019
1 01/01/2019 01/01/2020
2 01/01/2016 01/01/2017
2 01/01/2017 01/01/2018
2 01/01/2019 01/01/2020
我想编写查询以获取以下输出:
输出:
ID start_date end_date
1 01/01/2017 01/01/2020
2 01/01/2016 01/01/2018
2 01/01/2019 01/01/2020
您可以做一个累加的总和来解决这种离岛问题的变化:
select
id,
min(start_date) start_date,
max(end_date) end_date
from (
select
t.*,
sum(case when start_date = lag_end_date then 0 else 1 end)
over(partition by id order by start_date) grp
from (
select
t.*,
lag(end_date) over(partition by id order by start_date) lag_end_date
from mytable t
) t
) t
group by id, grp
order by id, grp
ID | START_DATE |结束日期-:| :--------- | :---------1 | 2017年1月1日| 2020年1月1日2 | 2016年1月1日| 2018年1月1日2 | 01/01/2019 | 2020年1月1日
这是间隙和孤岛的一种形式。
在这种情况下,我的建议是使用累积最大值来查看与前几行是否存在任何重叠,并使用该值来确定“岛屿”的起始位置。然后,使用累积和定义孤岛和聚合:
select id, min(start_date), max(end_date
from (select t.*,
sum(case when prev_end_date >= start_date then 0 else 1 end) over (partition by id order by start_date) as grp
from (select t.*,
lag(end_date) over (partition by id
order by start_date
rows between unbounded preceding and 1 preceding
) as prev_end_date
from t
) t
) t
group by id, grp;
Select id, Min(startdate), Max(case
when
lag(enddate)
over
(partition by id order by id) =startdate
then
Enddate end) from table group by
id;