使用 pd.read_csv 忽略只包含缺失值的列。

我创建了一个使用 pd.read_csv 读取数据的应用程序。有一些数据集，我们得到的数据列只包含缺失的值（空单元格）。有没有什么方法可以让pandas不把这些列加载到数据框架中？由于数据集可能相当大，在预加载阶段忽略它们会更方便。

当然，我可以从excel表中删除它们，但我的目标是使数据加载尽可能的自动化。

python pandas csv load

0
投票

你可以使用 pd.read_csv(file, keep_default_na=False)。所有的NA值将不会被加载，取而代之的是空行，所以这将节省内存.更多细节你可以阅读。https:/pandas.pydata.orgpandas-docsstablereferenceapipandas.read_csv.html。.