我想对下图中的“b”列进行重复数据删除,但是
distinct
函数不能与group by
或context by
子句一起使用,也不能保留元素的顺序。除了使用isDuplicated
功能对表进行解组和去重之外,还有其他方法吗?
可以使用循环函数,如下脚本所示:
t = table(`a`b as sym, array(INT[]).append!([1 2 1, 2 3 2]) as val)
// Not preserving the order
select sym, loop(distinct,val) as`val from t
// Preserving the order
select sym, loop(x -> x[ifirstHit{==,x,}:E(distinct x).sort()], val) as `val from t