找出 PySpark 中每个键的平均值位于哪个百分位数

问题描述 投票:0回答:0

我有一个数据框,其中列作为值,键和每个键的平均值。我需要计算 Pyspark 中每个键的平均值位于哪个百分位。

如何为每个键复制相同的输出。

能够使用 PERCENTRANK.INC 函数在 excel 中执行相同的操作。输出如下 -

Value Key Avg Percentile 46.68 198 44.4 0.316 57.30 198 44.4 0.316 0.91 198 44.4 0.316 72.68 198 44.4 0.316 2.05 171 3.5 0.434 3.72 171 3.5 0.434 3.08 171 3.5 0.434 4.93 171 3.5 0.434 3.62 171 3.5 0.434

注意 - 数据中有超过一千个键,因此需要自动化。

pyspark percentile
© www.soinside.com 2019 - 2024. All rights reserved.