Pyspark数据帧丢弃列问题

问题描述 投票:1回答:1

我试图从数据帧中删除两列,但我面临一个错误

**Error:**
drop() takes 2 positional arguments but 3 were given

***Code:***
 excl_columns= row['exclude_columns'].split(',')
 df=df.drop(*excl_columns)

#print(excl_columns)
#['year_of_birth', 'ethnicity']
python python-3.x pyspark spark-dataframe
1个回答
0
投票

这是应该工作的一种方式:

excl_columns = row['exclude_columns'].split(',')
df.select([c for c in df.columns if c not in excl_columns])
© www.soinside.com 2019 - 2024. All rights reserved.