将数据帧开始/停止时间转换为百分比仓

问题描述 投票:1回答:1

我想将开始/结束(或开/关)时间的数据帧转换为第二个数据帧,其中每个任意时间段的总“打开时间”百分比。在这种情况下,该时间段为一个小时。我写了一个涉及循环的效率很低的解决方案,正在寻找更好的解决方案。

df1

| Start               | End                 |
|---------------------|---------------------|
| 2020-02-01T00:00:00 | 2020-02-01T02:40:00 |
| 2020-02-01T02:55:00 | 2020-02-01T03:17:00 |
| 2020-02-01T03:27:00 | 2020-02-01T04:12:00 |
| 2020-02-01T04:20:00 | 2020-02-01T04:29:00 |
| 2020-02-01T05:19:00 | 2020-02-01T05:23:00 |
df2

| Time                | Percent |
|---------------------|---------|
| 2020-02-01T00:00:00 | 1       |
| 2020-02-01T00:01:00 | 1       |
| 2020-02-01T00:02:00 | 0.750   |
| 2020-02-01T00:03:00 | 0.833   |
| 2020-02-01T00:04:00 | 0.350   |
| 2020-02-01T00:05:00 | 0.066   |
python pandas dataframe time-series
1个回答
0
投票

处理此问题的一种方法是,如果数据不是太大,则以较低的频率和groupby进行重新采样:

s = pd.concat([pd.Series(pd.date_range(a,b, freq='S')) 
                  for a,b in zip(df1.Start, df1.End)],
              ignore_index=True
              )
s.groupby(s.dt.floor('H')).count()/3600

输出:

2020-02-01 00:00:00    1.000000
2020-02-01 01:00:00    1.000000
2020-02-01 02:00:00    0.750278
2020-02-01 03:00:00    0.833611
2020-02-01 04:00:00    0.350556
2020-02-01 05:00:00    0.066944
dtype: float64
© www.soinside.com 2019 - 2024. All rights reserved.