Seacat Catplot引发错误:真值不明确

问题描述 投票:0回答:1

我正在尝试使用seaborn库对数据框中的所有分类变量进行绘制,但是由于模棱两可的真值而导致出错。通常会出现“&”值,但是我无法在这里找到根本原因。我的目标是连续变量。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

target = df[target_col]
features = df[df.columns.difference([target_col])]

cat_cols = features.select_dtypes(include=['object']).columns.to_list()

fig, axes = plt.subplots(round(len(cat_cols) / 3), 3, figsize=(15, 15))
for i, ax in enumerate(fig.axes):
        if i < len(cat_cols):
           sns.catplot(x=cat_cols[i], y=target, kind='bar',data=df, ax = ax)

但是我收到以下错误。哪个部分导致此值错误?

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
pandas matplotlib seaborn visualization catplot
1个回答
0
投票

sns.catplot是网格级别的图,因此您不应将其放入子图。您可以使用带有barplot的facetgrid:

例如,这是您的数据:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame({'y':np.random.uniform(0,1,50),'A':np.random.choice(['a1','a2'],50),
                  'B':np.random.choice(['b1','b2'],50),'C':np.random.randint(0,10,50),
                  'D':np.random.choice(['d1','d2'],50),'E':np.random.choice(['e1','e2'],50)})
target_col = "y"
cat_cols = df.columns[df.dtypes==object]

seaborn使用长格式时效果更好,因此您可以像这样长时间旋转数据:

df.melt(id_vars=target_col,value_vars=cat_cols)

    y      variable value
0   0.606734    A   a1
1   0.603324    A   a2
2   0.938280    A   a2
3   0.718703    A   a1
4   0.808013    A   a1

列变量现在定义了要绘制的构面,并且x轴是您的值。我们直接称之为:

g = sns.FacetGrid(df.melt(id_vars=target_col,value_vars=cat_cols), 
col='variable', sharex=False,col_wrap=3)
g.map_dataframe(sns.barplot, x="value", y="y")

enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.