我想看一下一个变量的分布情况,其数值如下。
+-------+-------+
| Value | Count |
+-------+-------+
| 0.0 | 355 |
| 1.0 | 935 |
| 2.0 | 1 |
| 3.0 | 2 |
| 4.0 | 1 |
+-------+-------+
该表的数值一直到1000,但是 稀稀拉拉 (总观测值=1 622,几乎所有观测值均为0或1)
所以在绘制的时候,我做了。
sns.distplot(kde=True, a = df.loc[(df.class == 1)].variable_of_interest)
会产生以下红色分布
胜博发没有把握住最初的价值浓度,但对其余价值表现出更多的 "感性"
然后我想起了 pd.DataFrame.plot.kde()
所以我试了一下,它产生了这个情节,捕捉到了浓度
df.loc[(df.class== 1)].variable_of_interest.plot.kde()
重要提示:对于那些可能会注意到X轴上的差异的人,我尝试了seaborn与xlims(-500, 1000),但情节仍然完全相同。
你知道为什么他们会产生如此不同的图谱吗?是和他们处理数据的方式有关,还是我做错了什么?
先谢谢你了