outliers 相关问题

异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。

有没有办法将异常值拉到单独的 df 中?

嗨,我有一个包含 150 列和 200 行的数据框,我想遍历每一列并从每列的平均值中提取超过 3 sd 的任何数据点。 G-198804 G-198712 G-228253 G-

回答 0 投票 0

在钙属性的最大值(ind=19,value=290)或通常使用 R 的 df fastfood of library(openintro) 中的任何异常值周围画一个红色圆圈

我最近在 generakl 开始了我的 R 和数据科学之旅 到目前为止我已经写了这段代码 `install.packages("openintro") 图书馆(开放介绍) 安装.packages("ggplot2")

回答 1 投票 0

随时间更新的无监督实时离群图像检测

我正在尝试检测异常图像并需要一些指导。 想象一下我在海里有一个相机。摄像机正在 24/7 录制。一次只能在画面中看到一条鱼。 现在想象一下我

回答 0 投票 0

R 中分组数据帧的 DBSCAN 矩阵强制输入问题

我正在尝试使用包含多个组的函数将 dbscan 应用于数据框,但是我收到一条错误消息,指出 x 必须是矩阵: 添加缺少的分组变量:`group` 呃……

回答 0 投票 0

在使用 PYOD-ECOD 进行异常值检测的无监督学习时,Y 应该选择什么?

我有一个包含 6283 个样本和 21 个变量的数据集,我正在寻找一种方法来确定数据集中的异常值。 我使用了隔离森林、kNN、局部离群森林和 PCA 等......

回答 0 投票 0

在 R 中标记箱线图异常值

我有一个包含 130 行(人 ID)和 169 列(基因名称)的数据框。我已经能够使用以下代码为每个人创建一个箱线图 例如我的数据框看起来像...

回答 1 投票 0

为什么 trimr 包中的函数会删除所有数据?

我正在使用 Van Selst & Jolicoeur (1994) 描述的非递归方法从我的数据中删除异常值。为此,我一直在使用 trimr 包来删除参与者的异常值......

回答 2 投票 0

实时噪声测量中的异常值去除和位置近似

我正在尝试编写一个机器人定位程序,但我得到的测量结果非常嘈杂,并且有几个异常值。我对这些科目很陌生,所以我不知道从哪里开始。可以吗

回答 0 投票 0

具有分类和数值变量的数据集中的异常值检测和删除

我正在使用心电图数据集,我创建了一个包含 9 个变量和分类 NSP 变量的数据集,但是当我删除异常值类别 2,3 时,NSP 变量中的 2,3 被删除了。何...

回答 0 投票 0

在使用python计算滚动平均时,我们如何拒绝一个包含离群值的窗口?

我所面临的问题是,在使用python pandas计算滚动平均值时,如果10行中的一行或多行包含一个离群值,我如何拒绝一个窗口?澄清一下:df = df['...

回答 1 投票 0

删除后:离群值接近最大值,残留在R波谱图中。

在R中创建了一个函数,该函数应该返回一些数据用NA代替的离群值的向量,我得到了离群值剩余的最大附近:kill_outliers

回答 1 投票 0

r中对极端离群值的离群处理

我正在做一个学校项目,我已经找到了一些离群值在我的一个列。我相信这些离群值正在损害我的相关测试。我使用了以下代码来识别它们,boxplot(...)

回答 1 投票 0

DBSCAN的异常检测

我在我的训练数据集上使用DBSCAN,以便在训练模型之前找到离群值,并从数据集上删除这些离群值。我在我的训练行7697上使用DBSCAN,有8列。

回答 1 投票 0

如何检测多变量、多时间序列数据中的异常?

我试图在一个庞大的销售交易数据集(超过100万个观测值)中寻找异常,其中有数千名独特的客户。同一客户可以在同一日期多次购买。...

回答 1 投票 0

在ggplot中加入极端离群值的指示。

我的数据集中有一些非常非常少的离群值,使得boxplots难以阅读: library(ggplot2) mtcars$mpg[1] 。

回答 1 投票 8

用大熊猫替换混合数据框架中的异常值。

我有一个混合数据框架,有str、int和float类型。我在浮点数列中有一些离群值,我试图用df.mask(df.sub(df.mean()).div(df.std()).abs().gt(2))将它们替换为NaN,我'......

回答 1 投票 0

在Excel中为大型数据集编写单元格格式化公式:将离群值变成红色。

我有一个大的数据集(2209行x60列)(每列是一个化合物,即臭氧、乙烷等)的化合物浓度,我有一个特定的方法来计算离群值。基本上,我...

回答 1 投票 0

单级分类器训练

我正在研究一个分类问题,我只有一个类的数据,所以我想在这个 "目标 "类和其他所有可能的类之间进行分类,也就是 "Outlier "类。因此,...

回答 3 投票 4

在Python中快速删除列表中的异常值?

我有一个很长的时间和温度值列表,它的结构如下:list1=[[1,72],[2,72],[3,73],[4,72],[5,74],[6,73],[7,71],[8,92],[9,73]] 。有些时候...

回答 1 投票 1

stats.zscore是否可以替代以检测少于10行的数据框中的异常值?

我正在尝试找到一种方法,将设计用于大数据帧的算法应用于非常小的数据帧,因为其思想是从无线传感器动态接收每一行数据,并且它...]]

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.