在spark sql--pyspark中查找特定的字符串

问题描述 投票:-1回答:1

我正在尝试从员工数据框的数据框列中查找完全匹配的字符串

Employee  days_present
Alex      1,2,11,23,
John      21,23,25,28

需要根据days_present列查找第二天有哪些员工预期输出:亚历克斯

以下是我尝试过的内容

    df = spark.sql("select * from employee where days_present RLIKE '2')
    df.show()

This returns both Alex & John

此外,我想找出在2和11上出现的人,在这种情况下,预期输出仅为ALex

pandas apache-spark pyspark-sql
1个回答
0
投票

我们可以使用从Spark-2.4 +开始的array_intersect

函数,然后检查size >=2
© www.soinside.com 2019 - 2024. All rights reserved.