按列包含多个颜色图的热图

问题描述 投票:0回答:2

我有一个数据框,其中每列包含的值如果落在某个间隔内,则被视为“正常”,每列都不同:

# The main df
df = pd.DataFrame({"A": [20, 10, 7, 39], 
                   "B": [1, 8, 12, 9], 
                   "C": [780, 800, 1200, 250]})

df_info
表示
df
每列的间隔。 例如,
df_info["A"][0]
df["A"] 列的
min
df_info["A"][1]
代表df["A"] 列的
max
,依此类推。

df_info =  pd.DataFrame({"A": [22, 35], 
                   "B": [5, 10], 
                   "C": [850, 900]})

感谢这个SO答案我能够创建一个自定义热图,以低于范围的蓝色值、高于范围的红色值和范围内的白色值打印。请记住每列都有不同的范围。所以我根据这个进行标准化:

df_norm = pd.DataFrame()
for col in df:
    col_min = df_info[col][0]
    col_max = df_info[col][1]
    df_norm[col] = (df[col] - col_min) / (col_max - col_min)

终于打印了我的热图

vmin = df_norm.min().min()
vmax = df_norm.max().max()

norm_zero = (0 - vmin) / (vmax - vmin)
norm_one = (1 - vmin) / (vmax - vmin)
colors = [[0, 'darkblue'],
            [norm_zero, 'white'],
            [norm_one, 'white'],
            [1, 'darkred']
            ]
cmap = LinearSegmentedColormap.from_list('', colors, )
fig, ax = plt.subplots()

ax=sns.heatmap(data=data, 
            annot=True,
            annot_kws={'size': 'large'},
            mask=None,
            cmap=cmap,
            vmin=vmin,
            vmax=vmax) \
        .set_facecolor('white')

在示例中,您可以看到第三列的值比

0-1
间隔(以及第一列)高/低得多,因此它们“吸收”所有红色和蓝色色调。

问题: 我想要获得的是对每一列使用整个红色/蓝色色调,或者至少减少(例如)第一列和第三列之间的感知差异。

我有困难:

  1. 创建自定义颜色图,其中每个颜色图归一化按列执行
  2. 使用多个颜色图,每个颜色图应用于不同的列
  3. 应用颜色图
    mpl.colors.LogNorm
    但我不确定如何将它与我的自定义一起使用
    LinearSegmentedColormap
python pandas dataframe matplotlib heatmap
2个回答
3
投票

使用每列的掩码,您可以绘制每列的热图列,每个列都有自己的颜色图:

import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.colors import LinearSegmentedColormap
from matplotlib.cm import ScalarMappable

df = pd.DataFrame({"A": [20, 10, 7, 39],
                   "B": [1, 8, 12, 9],
                   "C": [780, 800, 1200, 250]})
df_info = pd.DataFrame({"A": [22, 35],
                        "B": [5, 10],
                        "C": [850, 900]})
df_norm = pd.DataFrame()
for col in df:
    col_min = df_info[col][0]
    col_max = df_info[col][1]
    df_norm[col] = (df[col] - col_min) / (col_max - col_min)

fig, ax = plt.subplots()

for col in df:
    vmin = df_norm[col].min()
    vmax = df_norm[col].max()

    norm_zero = (0 - vmin) / (vmax - vmin)
    norm_one = (1 - vmin) / (vmax - vmin)
    colors = [[0, 'darkblue'],
              [norm_zero, 'white'],
              [norm_one, 'white'],
              [1, 'darkred']]
    cmap = LinearSegmentedColormap.from_list('', colors)
    mask = df.copy()
    for col_m in mask:
        mask[col_m] = col != col_m

    sns.heatmap(data=df_norm,
                annot=df.to_numpy(), annot_kws={'size': 'large'}, fmt="g",
                mask=mask,
                cmap=cmap, vmin=vmin, vmax=vmax, cbar=False, ax=ax)

ax.set_facecolor('white')

colors = [[0, 'darkblue'],
          [1 / 3, 'white'],
          [2 / 3, 'white'],
          [1, 'darkred']]
cmap = LinearSegmentedColormap.from_list('', colors)
cbar = plt.colorbar(ScalarMappable(cmap=cmap), ax=ax, ticks=[0, 1 / 3, 2 / 3, 1])
cbar.ax.yaxis.set_ticklabels(['min\nlimit', 'min', 'max', 'max\nlimit'])
plt.tight_layout()
plt.show()


1
投票

您可以在绘图之前重新缩放

df_norm

# alternative method to scale
df_norm = (df - df_info.iloc[0])/(df_info.iloc[1]-df_info.iloc[0])

# scale the norm
df_plot = (df_norm - df_norm.min())/(df_norm.max()-df_norm.min())

# heat map on the normalized `df_plot`
# use values in `df_norm` to annotate
# color bar doesn't make sense so we remove it
sns.heatmap(df_plot, annot=df_norm, cmap='RdBu_r', cbar=False)

输出:

© www.soinside.com 2019 - 2024. All rights reserved.