在groupby中使用三元运算符的Python

问题描述 投票:3回答:2

有没有办法在groupby条件中使用三元运算符?显然这种语法无效。

d = {'name':['bil','bil','bil','jim'],
     'col2': ['acct','law', 'acct2','law'],
     'col3': [1,2,3,55],
     'col4': [1,1,1,2]

    }
df2 = pd.DataFrame(data=d)

df2[['col4']] = df2[['col4']].apply(pd.to_numeric)
df2.groupby(['name','col2'])['col4']\
    .max() if (.max()>30) else ''
python python-3.x pandas
2个回答
3
投票

你可以使用三元组,但我不打算告诉你。相反,这是一个更好的选择 - 掩盖结果:

v = df2.groupby(['name','col2'])['col4'].max()
v.where(v.gt(30), '')

lambda中使用groupbys可以大大减慢其操作速度。


0
投票

如果你想坚持使用三元,下面会做:

def condition(row):
    return row['col4'].max() if row['col4'].max() > 30 else ''

ds = df2.groupby(['name','col2']).apply(lambda row: condition(row))
© www.soinside.com 2019 - 2024. All rights reserved.