我正在尝试实现collect_list函数是Spark.SQL。通过数据框在PySpark中完成此操作的方法可用here
collect_list
我正在尝试通过SQL查询执行相同的操作。
与pyspark或Scala的Spark无关。
尝试一下:
SELECT c1, collect_list(struct(c2, c3)) FROM tempview/table GROUP BY c1
或根据您的要求的变体。