我现在有一些数据,它可能包含空值。
我想删除它的空值(整行或整列)。
如何处理对比?
这是我的数据
在时间序列数据中会有一些空值。
以下是我的代码
c=pd.read_csv('./in/historical_01A190.txt',error_bad_lines=False)
c.dropna(axis=0,how='any',inplace=True)
c.dropna(axis=1,how='any',inplace=True)
c.to_csv('./out/historical_01A190.txt',index=False)
但它的没有工作
谁能帮帮我?
好吧,首先,你的数据不是保存为csv。 它是以标签分隔的文件保存的。
所以你需要用 pd.read_table 打开它。
>>> c=pd.read_table('./data.txt',error_bad_lines=False,sep='\t')
其次,你的数据中充满了 nans -- 如果你在行或列上使用 dropna,你最终只剩下一行或一列(日期)。但是在你的文件上使用正确的打开器,dropna和to_csv函数可以工作。
如果你不对变量进行assing,那么它只会创建一个不存储在内存中的视图。
c = c.dropna(axis=0,how='any',inplace=True)
c = c.dropna(axis=1,how='any',inplace=True)
c = c.to_csv('./out/historical_01A190.txt',index=False)
试试这个。