如何使用PySpark从数据框中提取单个(列/行)值?

问题描述 投票:0回答:1

这是我的火花代码。它工作正常并返回2517.我想要做的就是打印“2517度”...但我不确定如何将2517提取到变量中。我只能显示数据帧但不能从中提取值。听起来很容易但不幸的是我被卡住了!任何帮助将不胜感激。谢谢!

df = sqlContext.read.format("csv").option("header", "true").option("inferSchema", "true").option("delimiter", "\t").load("dbfs:/databricks-datasets/power-plant/data")

df.createOrReplaceTempView("MyTable")

df = spark.sql("SELECT COUNT (DISTINCT AP) FROM MyTable")

display(df)
pyspark apache-spark-sql pyspark-sql databricks
1个回答
1
投票

我想你正在寻找collect。这样的东西可以让你获得价值:

df.collect()[0]['count(DISTINCT AP)']

假设列名是'count(DISTINCT AP)'

© www.soinside.com 2019 - 2024. All rights reserved.