outliers 相关问题

异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。

是否有R函数用每个级别的参与者数量替换ggplot中的异常点?

我正在研究GGPLOT(在此附后)。我想删除每个级别的参与者人数有异常的黑点。我确实知道outlier.shape = NA会删除异常值,但是...

回答 2 投票 0

Apache Druid:计数异常值

我准备了一个Apache Druid的安装,该安装从Kafka主题获取数据。它工作非常顺利和高效。我目前正在尝试实现一些查询,并且陷入了...

回答 1 投票 0

在执行分组后删除异常值

这是我的第一篇文章,所以请对我轻松一点。我正在尝试为每个国家从2000年到2015年的预期寿命绘制一个箱形图。我的CSV文件包含每个国家16次,...

回答 2 投票 0

我如何将组均值与单个观察值进行比较,并创建一个新的TRUE / FALSE列?

我是R的新手,这是我关于SO的第一篇文章-所以请多多包涵。我正在尝试识别数据集中的异常值。我有两个data.frames:(1-原始数据集,192行):观察值和...

回答 1 投票 0

Python Pandas:如何删除一列中的离群值,并用先前的值替换(假设它们不是离群值)?

我有一个看起来像这样的数据框:日期|值。 2020-03-18 10 2020-03-19 20 2020-03-20 30 2020-03-21 25 2020-03-22 35 2020-03-23 50 2020-03-24 1900000 2020-03-25 1200000 2020- 03-26 ...

回答 1 投票 0

用理论上的最小值/最大值替换数据框中的离群值

我有一个数据框,并被要求用理论上的最小值/最大值替换该数据框中的离群值。但是,我不确定这意味着什么。我想我已经算出理论上的...

回答 1 投票 0

按国家/地区在所有属性中应用z分数

我正在尝试清理一个数据集,其中包含2000年至2015年世界上每个国家的数据。每年的人口数据非常糟糕-我想为每个国家的人口数据分配z得分...

回答 1 投票 -1


当使用Spark出现数据倾斜时如何找到基于百分位数的阈值?

我有一个数据集-我正在尝试寻找一个sameity_score的阈值(变体和原始变体有多相似),可以用来过滤不相关的变体。 ...

回答 1 投票 0

计算一组特定列的离群值,然后标识具有5个以上具有离群值的列的ID

我正在使用大数据框(df)。我想根据平均值+ 3 sd计算特定列子集的离群值。我首先提取了想要的列,因此所有带有...

回答 2 投票 0

使用IQR方法在python中查找异常值,不包括中值

我正在计算一个小数据集的第一个四分位数和第三个四分位数,以确定离群值:6000 13500 15000 15000 17948虽然计算从理论上讲非常简单,但是我发现python ...

回答 1 投票 0

不包括基于R中多个列的异常值? IQR方法

我目前正在尝试根据所选变量的子集排除异常值,目的是进行敏感性分析。我已经调整了此处可用的功能:在...

回答 1 投票 0


检测和替换异常值

在我看来,有多种方法来处理数据集异常值>->删除数据>->使用对数或Bin进行转换>->使用平均中位数>->分别测试我有一个...

回答 1 投票 0

使用Numpy查找并打印数据的异常值

我想使用Pandas和Numpy在csv数据表列中找到任何异常值。目前,我可以在较高端获得离群值,但是我不确定如何获得最小离群值或“ ...

回答 1 投票 1

异常检测python

我有一个数据集,每个点有7个参数:

回答 1 投票 0

孤立森林在预测一个点而不是全部时给出不同的结果

我正在尝试检测某些数据中的异常。我有正常数据和被认为是异常的数据。我在python中使用scikit-learn库中的Isolation Forest。我已经从...

回答 1 投票 0

Isolation Forest大数据集

我有一个由(3862900,19)组成的数据库,每列是一个不同的参数,并且包含离群值,是否可以同时检测每列中的离群值,或者我必须重复它吗...

回答 1 投票 0

python:分位数代码未更改最大值和最小值

以下代码在删除异常值时未做任何更改。代码有什么问题?以pd格式导入大熊猫以np格式导入numpy导入随机df = pd.DataFrame({'price':np.random ....

回答 1 投票 0

数据框中的异常值,但我想对R中数据框中的分组行进行此操作

示例数据框。我想检测每组的离群值,并将其显示在单独的数据框中,例如,对于每个物种名称,金黄色拟南芥,我想查看值27.75、6.83和...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.