通过Spark SQL实现`collect_list`

问题描述 投票:-1回答:1

我正在尝试实现collect_list函数是Spark.SQL。通过数据框在PySpark中完成此操作的方法可用here

我正在尝试通过SQL查询执行相同的操作。

apache-spark apache-spark-sql pyspark-sql
1个回答
0
投票

与pyspark或Scala的Spark无关。

尝试一下:

SELECT c1, collect_list(struct(c2, c3)) FROM tempview/table GROUP BY c1

或根据您的要求的变体。

© www.soinside.com 2019 - 2024. All rights reserved.