我创建了一个使用 pd.read_csv 读取数据的应用程序。有一些数据集,我们得到的数据列只包含缺失的值(空单元格)。有没有什么方法可以让pandas不把这些列加载到数据框架中?由于数据集可能相当大,在预加载阶段忽略它们会更方便。
当然,我可以从excel表中删除它们,但我的目标是使数据加载尽可能的自动化。
你可以使用 pd.read_csv(file, keep_default_na=False)。所有的NA值将不会被加载,取而代之的是空行,所以这将节省内存.更多细节你可以阅读。https:/pandas.pydata.orgpandas-docsstablereferenceapipandas.read_csv.html。.