为每个Excel工作表创建框和胡须图

问题描述 投票:0回答:1

我对python / pandas / matplotlib的世界非常陌生,但我最近一直用它来制作盒子和胡须图。我很好奇如何使用特定的数据列为每张纸创建一个盒子和胡须图,即我有17张,我需要每个列都有一个名为HMB和DV的列。我想在HMB的Box和Whisker上绘制17个数据集,在DV图上绘制另外17个数据集。以下是我到目前为止的情况。

我可以打开文件,将所有表格放入list_dfs,但后来不知道从那里去哪里。我打算尝试手动切片每一组(在我来到这里之前开始寻求帮助),但是当我将来有更多数据时,我不想手动这样做。任何帮助将不胜感激!

import pandas as pd
import numpy as np
import xlrd
import matplotlib.pyplot as plt
%matplotlib inline
from pandas import ExcelWriter
from pandas import ExcelFile

excel_file =  'Comparison.xlsm'

list_dfs = []

xls = xlrd.open_workbook(excel_file,on_demand=True)
for sheet_name in xls.sheet_names():
    df = pd.read_excel(excel_file,sheet_name)
    list_dfs.append(df) 
#print(len(list_dfs))

a = list_dfs[0]
b = list_dfs[1]
c = list_dfs[2]
d = list_dfs[3]
e = list_dfs[4]
f = list_dfs[5]

data_a = a.loc[:,['DV','HMB']]
data_b = b.loc[:,['DV','HMB']]

我试图包括每张纸看起来像什么的图片。它们都具有相同的标题和布局,这是有帮助的。

编辑

所以我添加了下面建议的代码并删除了手动切片,现在我以字典格式提供了所有数据,但我不能让pandas或matplotlib为我绘图。我想知道是否有一个我失踪的步骤。我正在考虑为HMB制作一本字典,为DV制作一本字典。我想在列表中的每个条目的同一子图上有一个框和胡须图。

d_dv = {}
d_hmb = {}
for i, sheet_name in enumerate(xls.sheet_names()):
    df = pd.read_excel(excel_file,sheet_name)
    d_dv["PSPPM" + str(i)] = df.loc[:,['DV']]
    d_hmb["HMB" + str(i)] = df.loc[:,['HMB']]

Example of each sheets format

python pandas matplotlib jupyter-notebook
1个回答
1
投票

您可以从同一循环中创建每个切片df开始。为此,您可以定义字典并在每次迭代时添加新条目:

d = {}
for i, sheet_name in enumerate(xls.sheet_names()):
    df = pd.read_excel(excel_file,sheet_name)
    d["data" + str(i)] = df.loc[:,['DV','HMB']]
© www.soinside.com 2019 - 2024. All rights reserved.