我正在 Databricks 中实现计数不同的窗口函数。
select *,count(distinct Marks) over(partition by Name) from data
Databricks 似乎不支持 count distinct,我怎样才能在 databricks 中复制相同的查询。
使用
collect_set
+ size
功能:
select *, size(collect_set(Marks) over(partition by Name)) from data