如何应用具有多索引列的数据框中的一组列

Question

我有一个带有多索引列的数据框，如下所示，我想要做的是每个用户，对于m1和m2，我需要得到昨天的值+ 0.25 *值。

               m1              m2  
day           yesterday today yesterday today
user                                      
id1           5         6     7         8
id2           3         4     9         10

我尝试了以下内容，但是我在所有“今天”列中都获得了NA值：

df.iloc[:, df.columns.get_level_values(1)=='today'] = 
df.iloc[:, df.columns.get_level_values(1)=='yesterday'] *0.25 +
 df.iloc[:, df.columns.get_level_values(1)=='today']

我对其他stackoverflow帖子的搜索让我得到了按level = 0分组的可能答案，但我不知道如何从那里开始以及如何将一个函数应用于组的结果。或许这不是解决这个问题的正确方法？

df.groupby(level=0, axis=1).apply(...)

首先，我需要做的是：

               m1                      m2  
day           yesterday today          yesterday today
user                                      
id1               5     6+0.25*5       7         8+0.25*7
id2               3     4+0.25*3       9         10+0.25*9

最终，我需要：


user           m1              m2             
id1            6+0.25*5        8+0.25*7
id2            4+0.25*3        10+0.25*9

附：这是我第一次在StackOverflow上提问，我尽我所能！但如果我需要修改我的问题以遵循指南，请告诉我。谢谢！

Answer 1

使用DataFrame.xs进行选择，因此可以将DataFrames与多个常量相加。

功能的优势被删除顶级（默认值drop_level=True） - 所以在输出MultiIndexs中没有DataFrame。

print (df.xs('today', axis=1, level=1))
     m1  m2
id1   6   8
id2   4  10

print (df.xs('yesterday', axis=1, level=1))
     m1  m2
id1   5   7
id2   3   9

df1 = df.xs('today', axis=1, level=1) + 0.25 *df.xs('yesterday', axis=1, level=1)
print (df1)
       m1     m2
id1  7.25   9.75
id2  4.75  12.25

Answer 2

找到了！！！

def func(df):
    df.columns = df.columns.droplevel()
    return(df['today']+0.25*df['yesterday'])

然后：

df.groupby(level=0, axis=1).apply(func)

如何应用具有多索引列的数据框中的一组列

问题描述投票：2回答：2

2个回答

最新问题

如何应用具有多索引列的数据框中的一组列

问题描述 投票：2回答：2

2个回答

最新问题

问题描述投票：2回答：2