Pandas style.background_gradient 忽略 NaN

问题描述 投票:0回答:4

我有以下代码将数据帧

results
转储到 HTML 中的表格中,以便
TIME_FRAMES
中的列根据 seaborn 的颜色图进行着色。

import seaborn as sns

TIME_FRAMES = ["24h", "7d", "30d", "1y"]

# Set CSS properties for th elements in dataframe
th_props = [
    ('font-size', '11px'),
    ('text-align', 'center'),
    ('font-weight', 'bold'),
    ('color', '#6d6d6d'),
    ('background-color', '#f7f7f9')
]

# Set CSS properties for td elements in dataframe
td_props = [
    ('font-size', '11px')
]


cm = sns.light_palette("green", as_cmap=True)
s = (results.style.background_gradient(cmap=cm, subset=TIME_FRAMES)
                  .set_table_styles(styles))
a = s.render()
with open("test.html", "w") as f:
    f.write(a)

由此,我收到警告:

/python3.7/site-packages/matplotlib/colors.py:512:运行时警告: less xa[xa < 0] = -1

中遇到无效值

并且,如下图所示,列

30d
1y
无法正确渲染,因为它们具有 NaN。我怎样才能做到忽略 NaN 并且仅使用有效值渲染颜色?将 NaN 设置为 0 不是一个有效的选项,因为这里的 NaN 本身就有含义。

python pandas seaborn pandas-styles
4个回答
6
投票

这对我来说效果很好

df.style.applymap(lambda x: 'color: transparent' if pd.isnull(x) else '')

5
投票

有点晚了,但供以后参考。

我也遇到了同样的问题,这是我解决的方法:

import pandas as pd
import numpy as np
dt = pd.DataFrame({'col1': [1,2,3,4,5], 'col2': [4,5,6,7,np.nan], 'col3': [8,2,6,np.nan,np.nan]})

先把nas填个大值

dt.fillna(dt.max().max()+1, inplace=True)

将该最大值的字体涂成白色的函数

def color_max_white(val, max_val):
    color = 'white' if val == max_val else 'black'
    return 'color: %s' % color

将最大值背景着色为白色的功能

def highlight_max(data, color='white'):
    attr = 'background-color: {}'.format(color)
    if data.ndim == 1:  # Series from .apply(axis=0) or axis=1
        is_max = data == data.max()
        return [attr if v else '' for v in is_max]
    else:  # from .apply(axis=None)
        is_max = data == data.max().max()
        return pd.DataFrame(np.where(is_max, attr, ''),
                            index=data.index, columns=data.columns)

把所有东西放在一起

max_val = dt.max().max()

dt.style.format("{:.2f}").background_gradient(cmap='Blues', axis=None).applymap(lambda x: color_max_white(x, max_val)).apply(highlight_max, axis=None)

此链接帮助我找到了答案


2
投票

@quant 的答案几乎对我有用,但我的背景渐变仍然会使用最大值来计算颜色渐变。我实现了@night-train的建议来设置颜色图,然后使用了两个函数:

import copy
cmap = copy.copy(plt.cm.get_cmap("Blues"))
cmap.set_under("white")

def color_nan_white(val):
    """Color the nan text white"""
    if np.isnan(val):
        return 'color: white'

def color_nan_white_background(val):
     """Color the nan cell background white"""
    if np.isnan(val):
        return 'background-color: white'

然后再次将它们应用到我的数据框,从@quant借用,并稍作修改以方便使用:

(df.style
    .background_gradient(axis='index')
    .applymap(lambda x: color_nan_white(x))
    .applymap(lambda x: color_nan_white_background(x))
)

然后就完美运行了。


0
投票

在发现有一个内置选项之前,我确实应用了上面的一些答案: Styler.highlight_null.html。使代码稍微短一些并且更容易阅读。

以简单的方式应用:

(df.style
    .background_gradient(cmap=my_gradient)
    .highlight_null(color="transparent")
)
© www.soinside.com 2019 - 2024. All rights reserved.