我有形状为1000个观测值的数据框,有6列
前四个colummn为int,后两个column为字符串数据类型。
我需要帮助来找到可以帮助我使用tukey方法检测异常值并将异常值替换为nan值而不删除异常值的功能代码。
我尝试了许多代码来检测异常值,但是由于数据帧中的字符串数据类型,我面临着错误提示。
使用df.drop()方法删除最后两个字符串列
df.drop()
df.drop(['B', 'C'], axis=1)
使用Tukey方法识别异常值之后,使用df[i] = NaN替换异常值。
df[i] = NaN