熊猫重采样时间序列给出的开始和结束日期

问题描述 投票:1回答:1

我有稀疏日期为指数两列的大熊猫数据帧df1。我想,以产生具有给定的开始和含有df2值结束日期之间采样日期(每小时)的新数据帧df1

这里是df1

df1:
                     col1   col2
2019-01-01 07:12:00     1      0
2019-01-01 10:25:00     0      1

以下是应该df2开始和00:00:00和一个小时的采样上12:00:002019-01-01整理:

df2:
                     col1   col2
2019-01-01 00:00:00     0      0
2019-01-01 01:00:00     0      0
2019-01-01 02:00:00     0      0
2019-01-01 03:00:00     0      0
2019-01-01 04:00:00     0      0
2019-01-01 05:00:00     0      0
2019-01-01 06:00:00     0      0
2019-01-01 07:00:00     1      0
2019-01-01 08:00:00     0      0
2019-01-01 09:00:00     0      0
2019-01-01 10:00:00     0      1
2019-01-01 11:00:00     0      0
2019-01-01 12:00:00     0      0

我试着用熊猫据帧resample()功能,但没有成功pecifying开始和结束日期。

python pandas dataframe time-series
1个回答
0
投票

使用pandas.interpolate。以下是你应该做的步骤。

1)创建要在其中插入新的数据的时间戳列表。

2)追加时间戳此列表数据帧索引。这样一来,数据帧将拥有所有必需的指标,但column valuesNAN

3)分类索引数据帧

4)调用pandas.interpolate方法来填充在之间的值。您可以选择不同的参数,如在此法插值的类型。对于文档中详细看

© www.soinside.com 2019 - 2024. All rights reserved.