具有分类和数值变量的数据集中的异常值检测和删除

问题描述 投票:0回答:0

我正在使用心电图数据集,我创建了一个包含 9 个变量和分类 NSP 变量的数据集,但是当我删除异常值时,NSP 变量中的类别 2,3 被删除。我该如何解决这个问题?

我的python代码是:

dataimportances_new=datafeatures_new[['ASTV','ALTV','Mean','AC.1','DP.1','MSTV','UC.1','Mode','Median','NSP']].copy()

Q1_new = dataimportances_new.quantile(0.25)

Q3_new =dataimportances_new.quantile(0.75)
IQR_new = Q3_new - Q1_new
outliers_new=((dataimportances_new < (Q1_new - 1.5 * IQR_new)) | (dataimportances_new > (Q3_new + 1.5 * IQR_new))).sum() 

dataf_new_without_outliers_new = dataimportances_new[(dataimportances_new >= (Q1_new - 1.5*IQR_new)) & (dataimportances_new <= (Q3_new + 1.5*IQR_new))]

print(dataf_new_without_outliers_new.isna().sum())

dataf_new_without_outliers_new.dropna(inplace=True)

我试图用一个分类变量和 8 个数值变量在数据集中进行离群值检测。

python numeric detection categorical-data outliers
© www.soinside.com 2019 - 2024. All rights reserved.