pandas 将多个多索引列 csv 文件读取到指定标题的 dfs 会导致未命名的列

问题描述 投票:0回答:0

我的 csv(多索引列)看起来像这样:

,,companyName
,,2014_counts
nationalClass,nationalClassTitle,
426,"Food or edible material: processes, compositions, and products",31
424,"Drug, bio-affecting and body treating compositions",25 

我正在尝试使用以下代码以编程方式读取 csv 文件:

dfs=[]
csv_files = glob.glob(path + "/*.csv")

# read each csv file into a df
for file in csv_files:
    dfs.append(pd.read_csv(file, sep=',', header=[0,1,2], index_col=0))

我的输出是:

国民班 未命名:1_level_0
未命名:1_level_1
nationalclassTitle
companyName
2014_counts
未命名:2_level_2
426 食品或可食用材料:工艺、成分... 31
424 药物、生物影响和身体治疗复合物... 25

My desired 输出是:

国民班
nationalclassTitle
公司名称
2014_counts
426 食品或可食用材料:工艺、成分... 31
424 药物、生物影响和身体治疗复合物... 25

我不想创建新的 MultiIndex 并分配给此答案中所示的列: 在 Pandas DataFrame 多行标题中标记空值

pandas csv multi-index
© www.soinside.com 2019 - 2024. All rights reserved.