使用Pyspark的火花等

问题描述 投票:0回答:1

我如何接受输入服务的uuid,然后在Pyspark中的DataFrame的服务uuid​​列中检查匹配的值?例如,如果我将输入ID设置为1be7c239-eef0-4f77-ad4c-bde82fe23b55,那么我只希望从DataFrame获得该ID的统计信息。

python apache-spark pyspark pyspark-sql pyspark-dataframes
1个回答
0
投票

您可以尝试以下一种方法:

service_id = "1be7c239-eef0-4f77-ad4c-bde82fe23b55"
df.createOrReplaceTempView("data")
spark.sql(f"SELECT * from data where service_uuid='{service_id}'").collect() # replace service_uuid with the correct column name

或:

df.filter(df.service_uuid == service_id).collect()
© www.soinside.com 2019 - 2024. All rights reserved.