如何检查日期时间列中缺少哪些值

问题描述 投票:0回答:1

我对我的数据集有疑问。我想检查我的数据框中缺少哪个日期和时间(见图)。 DF 我想知道名为“开始时间”和“结束时间”的列。

我该如何解决这个问题?

我试过了:

pd.date_range(start = '2019-01-01 00:00:00', end = '2022-12-31 23:00:00' ).difference(allmerged.index)

但这不起作用。

尝试注释中建议的代码会产生以下输出: output image

python pandas datetime time-series nan
1个回答
0
投票

首先在样本数据中有频率

15Min
,如果需要测试这个频率添加参数
freq
date_range

r = pd.date_range(start='2019-01-01 00:00:00', end='2022-12-31 23:00:00', freq='15Min')

如有必要,将两列转换为日期时间:

df[['starttime','endtime']] = df[['starttime','endtime']].apply(pd.to_datetime)

Index.difference
的最后测试:

#testing both together
out = r.difference(np.ravel(df[['starttime','endtime']].to_numpy()))

out = r.difference(df[['starttime','endtime']].stack())

#testing separately
start = r.difference(df['starttime'])
end = r.difference(df['endtime'])
© www.soinside.com 2019 - 2024. All rights reserved.