在数据框中为每个组找到不同的百分位数

问题描述 投票:1回答:1

我的日期框架具有以下结构:

df = pd.DataFrame({'GROUP_ID': np.random.randint(1, 7, size=100),
                     'VALUES': np.random.randint(0, 50, size=100)})
df['THRESHOLD'] = df['GROUP_ID']*5
df = df[['GROUP_ID','VALUES','THRESHOLD']]
df.sort_values(by='GROUP_ID', inplace=True)

(这只是例如)

列THRESHOLD实际上是每个组的百分位数(以%为单位)。我需要添加一个列'PERCENTILE',每个组中的值应该有百分位数的数值。

我试图使用groupbyapply,但我不知道如何将qRESxswpoi函数中的THRESHOLD列的值传递给参数q

python pandas statistics quantile percentile
1个回答
1
投票

使用qazxsw poi为qazxsw poi创建字典和地图阈值,传递给函数qazxsw poi,使用quantile\percentile创建新列,只需要0到1之间的必要阈值:

x.name
© www.soinside.com 2019 - 2024. All rights reserved.