Pyspark-过滤器-错误-列名不存在属性-数据帧中存在列[关闭]

问题描述 投票:0回答:1
我是pyspark的新手。

我正在尝试做一个基本的过滤器,并收到以下错误。

我有一个数据框,并尝试按年份将其过滤掉。

df_storm_filtered = df_storm.filter(df_storm.YEAR == 2012)

并且我收到以下错误

AttributeError: 'DataFrame' object has no attribute 'YEAR'

然后我尝试了以下操作

df_storm_filtered = df_storm.filter(df_storm['YEAR'] == '2012')

pyspark.sql.utils.AnalysisException: u'Cannot resolve column name "YEAR" among (value);'
即使它在数据框中,也无法识别列名YEAR。我知道这是非常基本的。只是想知道是什么原因引起的。任何解决这个问题的建议。预先感谢您的帮助。
python dataframe pyspark pyspark-sql pyspark-dataframes
1个回答
0
投票
对不起。我使用了错误的READ。我使用TEXT而不是CSV。请忽略我的问题。
© www.soinside.com 2019 - 2024. All rights reserved.