具有不同晶须长度的Python箱形图

问题描述 投票:0回答:4

我在Pandas中使用DataFrame.boxplot()函数,我认为它称为matplotlib.pyplot.boxplot()。该文档说,这些箱形图的默认晶须长度应为1.5IQR,但我不明白为什么同一盒中的上/下晶须长度不同。 (我没有做任何特定的配置)

抱歉,我想发布图片,但是我没有足够的声誉,所以我将其放在免费的图片托管网站上,链接:

http://postimg.org/image/z0xtfg9gd/

python pandas matplotlib
4个回答
2
投票

听起来像是对箱形图的普遍误解。

晶须长度从一个箱形图到任何其他箱形图的变化有两个原因

  1. 每个数据集的IQR都不同
  2. 晶须仅在该Q1-1.5 * IQR和Q3 + 1.5 * IQR范围内延伸最外点。因此,如果Q3 + 1.5 * IQR = 75,但样本的最大值为70,则晶须在70处绘制。

3
投票

您是在问为什么顶部晶须与底部晶须的长度不同?我认为晶须实际上是1.5 IQR内的最低或最高数据点。因此,如果在Q3和Q3 + 1.5 IQR之间没有数据点,则不会出现顶部晶须。对于一个箱形图,其中在顶部和底部的胡须超出了异常值,胡须的确具有相同的大小。


0
投票

晶须的长度不同,因为IQR可以每个数据集不同

Interquartile range保留所有数据的50%,因此,当数据更广泛时,范围更广。另外,如果所有数据点都在Q1-1.5 * IQR和Q3 + 1.5 * IQR范围内,则晶须只会被拉至这些点,这也将使其变小。


-1
投票

您是否找到问题的答案?我遇到了同样的问题。我想知道晶须的定义。我认为1.5 * IQR的规则仅适用于正态分布的数据。如果数据偏斜,则晶须(我现在仅查看ONE箱线图!)的大小似乎有所不同,因此1.5 * IQR并没有真正匹配。有任何线索吗?

© www.soinside.com 2019 - 2024. All rights reserved.