Value

问题描述 投票:0回答:1

我想看一下一个变量的分布情况,其数值如下。

+-------+-------+
| Value | Count |
+-------+-------+
| 0.0   |   355 |
| 1.0   |   935 |
| 2.0   |     1 |
| 3.0   |     2 |
| 4.0   |     1 |
+-------+-------+

该表的数值一直到1000,但是 稀稀拉拉 (总观测值=1 622,几乎所有观测值均为0或1)

所以在绘制的时候,我做了。

sns.distplot(kde=True, a = df.loc[(df.class == 1)].variable_of_interest)

会产生以下红色分布

KDE Plot with seaborn

胜博发没有把握住最初的价值浓度,但对其余价值表现出更多的 "感性"

然后我想起了 pd.DataFrame.plot.kde() 所以我试了一下,它产生了这个情节,捕捉到了浓度

df.loc[(df.class== 1)].variable_of_interest.plot.kde()

Pandas KDE Distribution

重要提示:对于那些可能会注意到X轴上的差异的人,我尝试了seaborn与xlims(-500, 1000),但情节仍然完全相同。

你知道为什么他们会产生如此不同的图谱吗?是和他们处理数据的方式有关,还是我做错了什么?

先谢谢你了

python pandas seaborn difference kde
1个回答
© www.soinside.com 2019 - 2024. All rights reserved.