我在Pandas中使用DataFrame.boxplot()
函数,我认为它称为matplotlib.pyplot.boxplot()
。该文档说,这些箱形图的默认晶须长度应为1.5IQR,但我不明白为什么同一盒中的上/下晶须长度不同。 (我没有做任何特定的配置)
抱歉,我想发布图片,但是我没有足够的声誉,所以我将其放在免费的图片托管网站上,链接:
听起来像是对箱形图的普遍误解。
晶须长度从一个箱形图到任何其他箱形图的变化有两个原因
您是在问为什么顶部晶须与底部晶须的长度不同?我认为晶须实际上是1.5 IQR内的最低或最高数据点。因此,如果在Q3和Q3 + 1.5 IQR之间没有数据点,则不会出现顶部晶须。对于一个箱形图,其中在顶部和底部的胡须超出了异常值,胡须的确具有相同的大小。
晶须的长度不同,因为IQR可以每个数据集不同!
Interquartile range保留所有数据的50%,因此,当数据更广泛时,范围更广。另外,如果所有数据点都在Q1-1.5 * IQR和Q3 + 1.5 * IQR范围内,则晶须只会被拉至这些点,这也将使其变小。
您是否找到问题的答案?我遇到了同样的问题。我想知道晶须的定义。我认为1.5 * IQR的规则仅适用于正态分布的数据。如果数据偏斜,则晶须(我现在仅查看ONE箱线图!)的大小似乎有所不同,因此1.5 * IQR并没有真正匹配。有任何线索吗?