我正在处理一个大型数据集(超过400列,200000行),对于一些没有记录的值,在该槽中有一个'-9999.99'的值。我如何通过python从导入的数据中删除这些值?我是用pandas中的csv文件导入的。我不想删除整个列,只想删除任何一个有-9999.99值的数据框,因为它没有意义,并且弄乱了我的平均值和标准差值。谢谢!我正在处理一个大型数据集,其中有-9999.99值的数据框,因为它没有意义,而且会弄乱我的平均值和标准差值。
在DataFrame中加载数据后,替换是一种选择。
df = df.replace(-9999.99, '')
或者...
df = df.replace(-9999.99, np.nan)