Python:如何在pandas数据框中基于delta时间选择行?

问题描述 投票:0回答:1

我有一个数据框,如下所示。

df

          i   j      t_start_date_x        t_end_date_x      t_start_date_y     t_end_date_y
20149   491 191 2020-03-20 12:44:03 2020-03-20 16:03:57 2020-03-20 10:40:47 2020-03-20 17:12:14
20150   504 505 2020-03-20 12:54:14 2020-03-20 16:20:48 2020-03-20 16:39:59 2020-03-20 22:59:14
20151   505 504 2020-03-20 16:39:59 2020-03-20 22:59:14 2020-03-20 12:54:14 2020-03-20 16:20:48
20152   506 282 2020-03-20 10:39:35 2020-03-20 16:31:48 2020-03-20 15:24:32 2020-03-20 15:34:34
20153   515 494 2020-03-20 12:56:40 2020-03-20 18:58:15 2020-03-20 09:55:16 2020-03-20 15:31:22

我想只保留时间上有重叠的行。

          i   j      t_start_date_x        t_end_date_x      t_start_date_y     t_end_date_y
20149   491 191 2020-03-20 12:44:03 2020-03-20 16:03:57 2020-03-20 10:40:47 2020-03-20 17:12:14
20152   506 282 2020-03-20 10:39:35 2020-03-20 16:31:48 2020-03-20 15:24:32 2020-03-20 15:34:34
20153   515 494 2020-03-20 12:56:40 2020-03-20 18:58:15 2020-03-20 09:55:16 2020-03-20 15:31:22
python pandas dataframe timestamp
1个回答
1
投票

你可以通过检查't_start_date_x'是否在't_end_date_y'之前,并且相同的反转x和y来实现。

mask_overlap = ((df['t_start_date_x']<=df['t_end_date_y'])
               & (df['t_start_date_y']<=df['t_end_date_x']))
df_overlap = df[mask_overlap]
© www.soinside.com 2019 - 2024. All rights reserved.