使用Tukey方法python从数据集中检测离群值

问题描述 投票:0回答:1

我有形状为1000个观测值的数据框,有6列

前四个colummn为int,后两个column为字符串数据类型。

我需要帮助来找到可以帮助我使用tukey方法检测异常值并将异常值替换为nan值而不删除异常值的功能代码。

我尝试了许多代码来检测异常值,但是由于数据帧中的字符串数据类型,我面临着错误提示。

python statistics outliers tukey
1个回答
0
投票

使用df.drop()方法删除最后两个字符串列

df.drop(['B', 'C'], axis=1)

使用Tukey方法识别异常值之后,使用df[i] = NaN替换异常值。

© www.soinside.com 2019 - 2024. All rights reserved.