我有两列。一个是user_ids,另一个是每个用户的生产值。我想知道最活跃用户中前10%的生产百分比。
我尝试过Lead,但由于我不知道它是如何工作的,我无法得到正确的结果。
这是我的表的样本
userid | production
42539973@N00 | 6572
13407304@N05 | 6765
50780708@N02 | 6958
92607898@N00 | 7826
52996072@N04 | 7889
57868312@N00 | 8226
90484572@N00 | 8444
26650236@N07 | 8802
26650236@N08 | 88802
26650236@N09 | 98802
例如,10%的用户是1,如果我们根据“生产”价值订购它们是最后一个用户,并且这个用户生产了近39%的整个生产量,这是由10%od用户的生产总和计算得出的由所有产值的总和。
由于您没有向我们展示预期的输出,我刚刚创建了SQL,用于过滤10%最具生产力的用户,其生产总和除以所有用户的生产。
with cnt as (select round(count(1)*0.1) no_users, sum(production) production_sum from your_table),
users as (select userid, distance production,
sum(production) over (order by production desc rows between unbounded preceding and 0 FOLLOWING) production_10,
row_number() over (order by production desc) rnk,
no_users,
production_sum
from your_table, cnt)
select no_users,
production_10,
production_sum,
round(production_10/production_sum*100,2) prc_production
from users
where no_users=rnk