outliers 相关问题

异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。

在箱形图中,如何显示异常值,但实际上并未绘制出来?

在我们的数据集中,我们有一些绝对巨大的离群值。如果我们绘制(例如在箱线图中)并包括离群值,则轴将被挤压到无用。日志扩展没有帮助。但是我们要...

回答 1 投票 0

如何分别排除目标对象和R中的离群值

我(R)非常陌生,我想知道是否能得到一些帮助。我想知道如何排除每个参与者平均反应时间和每个目标的两个标准差的离群值。...

回答 2 投票 0

在任何列中找到具有异常值的行

在数据框df中提供如下所示的数据,需要提取对任何列均具有离群值的行。 text =“ A,B,C,D,E,F,G,93,53,221,314,104,721,179 100,58,218,318,93,718,181 601,61,228,829,106,...

回答 1 投票 0

Winsorize离群值

我有一个包含200,000个观测值和23个不同列的数据框。我绘制了数据,发现每列中都有离群值。因此,我想赢得整个数据框架。 ...

回答 1 投票 0

R中的KNN离群值检测

[我正在尝试运行一个脚本,该脚本使用加权的KNN离群值来执行离群值检测,但始终出现以下错误:apply(kNNdist(x = dat,k = k),1,mean)中的错误: ...

回答 1 投票 0

如何在熊猫中编写离群值的用户定义函数

假设我有一个数据框,导入大熊猫作为pd数据= pd.DataFrame()数据[“名称”] = [“ A”,“ B”,“ C”,“ D”,“ E”,“ F” ,“ G”,“ H”,“ I”,“ J”] data [“ age”] = [22,9,505,39,50,17,26,33,-43,48] data [“ marks”] = [422,59,...

回答 2 投票 0

我应该如何处理R中多个变量的离群值?

我是统计编程的新手,我目前正在研究信用违约数据集中19个变量的110000个观测值的数据集,并希望创建一些模型,例如逻辑模型...

回答 1 投票 0

当我使用OneClassSVM执行异常检测时,为什么会得到[[LibSVM]`

我正在使用Python的Scikit-Learn lib执行异常检测。我正在使用OneClassSVM。我有一个问题,因为每当我运行我的代码时(我没有得到错误),它都会显示[LibSVM]。我不知道为什么...

回答 1 投票 0

使用GridSearchCV和OneClassSVM时,`NU`值有错误

我正在使用GridSearchCV为我的模型OneClassSVM查找最佳参数。我在文档中已经读到nu值应该在0到1之间。在我的代码中,我总是遇到错误:ValueError:nu <= ...

回答 1 投票 0

在使用Python Scikit-Learn lib的调查中检测异常值

我制作了一个“调查”的虚拟数据集。调查有5个问题,每个问题有5个不同的答案(1、2、3、4、5)。我的目标是确定是否有人在调查中给出随机答案(...

回答 1 投票 0

返回没有触发器的更新更改的值

Postgres对于INSERT,DELETE和UPDATE有一个很棒的RETURNING子句,这让我有点贪心。在某些情况下,我想得到的不仅是当前值,还有以前的值:...

回答 1 投票 2

如何根据一列中所有其他数字的平均值重置一些离群值?

我需要用平均值替换大于平均值的2倍或小于列中所有其他数字的平均值的1/2的异常值。例如,我有一个...

回答 1 投票 0

如何在Matlab中过滤某个阈值内的数据?

我希望删除下图中红线上方和下方的数据,这意味着删除1.2以上和-1.2以下的数据。我使用以下函数:threshold = [-1.2,1.2]; y = rmoutliers(y,'...

回答 2 投票 0

将df.where应用于熊猫中的选择性列以删除混合数据类型数据集中的异常值

Python和pandas新手设置了数据清理管道以准备df以进行机器学习。我想识别并删除异常值,并在适当位置替换(例如)算术平均值。 ...

回答 1 投票 0

在散点图上标记离群值

我有一个如下所示的数据框:print(df.head(10))日CO2 1 549.500000 2 663.541667 3 830.416667 4 799.695652 5 813.850000 6 769.583333 7 681.941176 ...

回答 3 投票 2

如何在数据帧的每一列上计算修改后的Z得分和IQR

我有一个数据框,我正在尝试在分析之前清除数据。我试图处理异常值,并尝试计算Modified Z得分(中位数1)和IQR,以滤除...

回答 1 投票 1

是否有用于检测异常值的内置方法?

[当我使用Matlab时,我正在使用方法filloutliers。我想知道是否有与C ++类似的东西。换句话说,我想知道是否有某种内置方法...

回答 1 投票 0

ř校正不一致的数据记录

我记录每5分钟四个变量。当我绘制的四个变量R A的时间序列我意识到变量3记录不一致的数据,由于数据收集在一个错误(...

回答 2 投票 1

非线性回归与Keras损失没有减少:异常值和/或数据格式的问题?

我拥有一个数据表和它的两个列产生一个情节,看起来像这样。请注意,Y轴是在日志中。不介意随机汉字。这已经固定我想这可能是一个...

回答 2 投票 0

有什么想法在数据集中有效处理异常值而不删除它

我是数据科学的初学者。在参加黑客马拉松时面对挑战。我有一个火车数据集,在许多列中有很多异常值。与测试数据相同(提供的培训和测试数据......

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.