我正在尝试做一个基本的过滤器,并收到以下错误。
我有一个数据框,并尝试按年份将其过滤掉。
df_storm_filtered = df_storm.filter(df_storm.YEAR == 2012)
并且我收到以下错误
AttributeError: 'DataFrame' object has no attribute 'YEAR'
然后我尝试了以下操作
df_storm_filtered = df_storm.filter(df_storm['YEAR'] == '2012')
pyspark.sql.utils.AnalysisException: u'Cannot resolve column name "YEAR" among (value);'
即使它在数据框中,也无法识别列名YEAR。我知道这是非常基本的。只是想知道是什么原因引起的。任何解决这个问题的建议。预先感谢您的帮助。