异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。
嗨,我有一个包含 150 列和 200 行的数据框,我想遍历每一列并从每列的平均值中提取超过 3 sd 的任何数据点。 G-198804 G-198712 G-228253 G-
在钙属性的最大值(ind=19,value=290)或通常使用 R 的 df fastfood of library(openintro) 中的任何异常值周围画一个红色圆圈
我最近在 generakl 开始了我的 R 和数据科学之旅 到目前为止我已经写了这段代码 `install.packages("openintro") 图书馆(开放介绍) 安装.packages("ggplot2")
我正在尝试检测异常图像并需要一些指导。 想象一下我在海里有一个相机。摄像机正在 24/7 录制。一次只能在画面中看到一条鱼。 现在想象一下我
我正在尝试使用包含多个组的函数将 dbscan 应用于数据框,但是我收到一条错误消息,指出 x 必须是矩阵: 添加缺少的分组变量:`group` 呃……
在使用 PYOD-ECOD 进行异常值检测的无监督学习时,Y 应该选择什么?
我有一个包含 6283 个样本和 21 个变量的数据集,我正在寻找一种方法来确定数据集中的异常值。 我使用了隔离森林、kNN、局部离群森林和 PCA 等......
我有一个包含 130 行(人 ID)和 169 列(基因名称)的数据框。我已经能够使用以下代码为每个人创建一个箱线图 例如我的数据框看起来像...
我正在使用 Van Selst & Jolicoeur (1994) 描述的非递归方法从我的数据中删除异常值。为此,我一直在使用 trimr 包来删除参与者的异常值......
我正在尝试编写一个机器人定位程序,但我得到的测量结果非常嘈杂,并且有几个异常值。我对这些科目很陌生,所以我不知道从哪里开始。可以吗
我正在使用心电图数据集,我创建了一个包含 9 个变量和分类 NSP 变量的数据集,但是当我删除异常值类别 2,3 时,NSP 变量中的 2,3 被删除了。何...
在使用python计算滚动平均时,我们如何拒绝一个包含离群值的窗口?
我所面临的问题是,在使用python pandas计算滚动平均值时,如果10行中的一行或多行包含一个离群值,我如何拒绝一个窗口?澄清一下:df = df['...
在R中创建了一个函数,该函数应该返回一些数据用NA代替的离群值的向量,我得到了离群值剩余的最大附近:kill_outliers
我正在做一个学校项目,我已经找到了一些离群值在我的一个列。我相信这些离群值正在损害我的相关测试。我使用了以下代码来识别它们,boxplot(...)
我在我的训练数据集上使用DBSCAN,以便在训练模型之前找到离群值,并从数据集上删除这些离群值。我在我的训练行7697上使用DBSCAN,有8列。
我试图在一个庞大的销售交易数据集(超过100万个观测值)中寻找异常,其中有数千名独特的客户。同一客户可以在同一日期多次购买。...
我的数据集中有一些非常非常少的离群值,使得boxplots难以阅读: library(ggplot2) mtcars$mpg[1] 。
我有一个混合数据框架,有str、int和float类型。我在浮点数列中有一些离群值,我试图用df.mask(df.sub(df.mean()).div(df.std()).abs().gt(2))将它们替换为NaN,我'......
在Excel中为大型数据集编写单元格格式化公式:将离群值变成红色。
我有一个大的数据集(2209行x60列)(每列是一个化合物,即臭氧、乙烷等)的化合物浓度,我有一个特定的方法来计算离群值。基本上,我...
我正在研究一个分类问题,我只有一个类的数据,所以我想在这个 "目标 "类和其他所有可能的类之间进行分类,也就是 "Outlier "类。因此,...
我有一个很长的时间和温度值列表,它的结构如下:list1=[[1,72],[2,72],[3,73],[4,72],[5,74],[6,73],[7,71],[8,92],[9,73]] 。有些时候...
stats.zscore是否可以替代以检测少于10行的数据框中的异常值?
我正在尝试找到一种方法,将设计用于大数据帧的算法应用于非常小的数据帧,因为其思想是从无线传感器动态接收每一行数据,并且它...]]