我正在尝试从员工数据框的数据框列中查找完全匹配的字符串
Employee days_present
Alex 1,2,11,23,
John 21,23,25,28
需要根据days_present列查找第二天有哪些员工预期输出:亚历克斯
以下是我尝试过的内容
df = spark.sql("select * from employee where days_present RLIKE '2')
df.show()
This returns both Alex & John
此外,我想找出在2和11上出现的人,在这种情况下,预期输出仅为ALex
我们可以使用从Spark-2.4 +开始的array_intersect
size >=2