我在 R 中构建了一些箱线图,并且有几个异常值。我知道设置异常值限制的默认标准是:
但是,我希望将异常值分类为超出边界的值:
可以在R中设置吗?
来自
?boxplot
范围:这决定了图须从盒子中延伸出多远。如果“范围”为正,须线会延伸到最极端的数据点,该数据点不超过“范围”乘以盒子的四分位数间距。值为零会导致晶须延伸至数据极值。
所以设置
range=3
我鼓励你不要在没有深思熟虑的情况下这样做——人们期望胡须延长 1.5 个 IQR。更改范围将违反这些假设,并使人们很容易从您的图形中得出错误的结论。
在Python中, whis :控制须长度的参数。如果是标量,胡须将被绘制到距最近铰链 whis * IQR 内最远的数据点。如果是一个元组,它被解释为胡须代表的百分位数
将seaborn导入为sns
sns.boxplot(x=特征,色调=“标签”,数据=df,whis=3)