如何创建[(行,行)]的数据集

问题描述 投票:0回答:1

我有一个接受Dataset[(Row, Row)]的函数,我正在尝试测试此函数,但是我不确定如何创建一个Dataset[(Row, Row)]的数据集。>

我尝试了以下操作,但它说这是tuple2[DataFrame, DataFrame]类型

      val df: Dataset[(Row,Row)] = (
        Seq(
          ("NOW", "active", 1, 11),
          ("BEFORE", "active", 2, 11),
          ("AFTER", "active", 3, 33)
        ).toDF(),
        Seq(
          ("NOW", "sub_uuid1", 1, "com_uuid1"),
          ("BEFORE", "sub_uuid2", 2, "com_uuid2"),
          (null, null, 3, null)
        ).toDF()
      )

我如何编写上面的内容,所以它的类型为Dataset[(Row,Row)]

我有一个接受Dataset [(Row,Row)]的函数,我正在尝试测试此功能,但是我不确定我如何创建一个具有Dataset [(Row,Row)]的数据集。尝试了以下内容,但是...

scala apache-spark apache-spark-sql apache-spark-dataset
1个回答
-1
投票

因为您创建了Dataset[Row]的元组:

© www.soinside.com 2019 - 2024. All rights reserved.