具有多列数据及其均值的分类图

问题描述 投票:0回答:2

我想在同一图中创建两个熊猫DataFrame列ab的分类图,并且共享x轴和y轴不同:

import pandas as pd
import seaborn as sns

example = [
    ('exp1','f0', 0.25, 2),
    ('exp1','f1', 0.5, 3),
    ('exp1','f2', 0.75, 4),
    ('exp2','f1', -0.25, 1),
    ('exp2','f2', 1, 2),
    ('exp2','f3', 0, 3)
]
df = pd.DataFrame(example, columns=['exp', 'split', 'a', 'b'])
mean_df = df.groupby('exp')['a'].mean()
g = sns.catplot(x='exp', y='a', data=df, jitter=False)
ax2 = plt.twinx()
sns.catplot(x='exp', y='b', data=df, jitter=False, ax=ax2)

在此实现中,我遇到的问题是类别(x值)的颜色与列的颜色不同。我可以选择这个,还是必须更改数据结构?

我也想像这样在图像中连接分类值的均值:image

pandas matplotlib seaborn
2个回答
0
投票

您可能想先融化数据:

data = df.melt(id_vars='exp', value_vars=['a','b'])

fig, ax = plt.subplots()
sns.scatterplot(data=data,
                x='exp',
                hue='variable',
                y='value',
                ax=ax)

(data.groupby(['exp','variable'])['value']
     .mean()
     .unstack('variable')
     .plot(ax=ax, legend=False)
)
ax.set_xlim(-0.5, 1.5);

输出:

enter image description here


0
投票
df = pd.DataFrame(example, columns=['exp', 'split', 'a', 'b'])
mean_df = df.groupby('exp').mean().reset_index()

fig, ax1 = plt.subplots()
ax2 = ax1.twinx()

sns.scatterplot(x='exp', y='a', data=df, color='C0', ax=ax1)
sns.scatterplot(x='exp', y='b', data=df, color='C1', ax=ax2)

sns.lineplot(x='exp',y='a', data=mean_df, color='C0', ax=ax1)
sns.lineplot(x='exp',y='b', data=mean_df, color='C1', ax=ax2)

enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.