这是我的火花代码。它工作正常并返回2517.我想要做的就是打印“2517度”...但我不确定如何将2517提取到变量中。我只能显示数据帧但不能从中提取值。听起来很容易但不幸的是我被卡住了!任何帮助将不胜感激。谢谢!
df = sqlContext.read.format("csv").option("header", "true").option("inferSchema", "true").option("delimiter", "\t").load("dbfs:/databricks-datasets/power-plant/data")
df.createOrReplaceTempView("MyTable")
df = spark.sql("SELECT COUNT (DISTINCT AP) FROM MyTable")
display(df)
我想你正在寻找collect
。这样的东西可以让你获得价值:
df.collect()[0]['count(DISTINCT AP)']
假设列名是'count(DISTINCT AP)'