检测异常值的最佳方法是什么?

问题描述 投票:1回答:1

我有一串数字进来,我想把它们标记为1,如果异常,0如果不是异常值。我有两种方法:

1)我计算进入的数字的滚动平均值。然后,我计算计算的数字平均值的滚动标准偏差。使用这些值,我创建置信度(μ±3σ) 2)我计算进入数字的滚动均值和标准差。用这些值,我创建置信度(μ±3σ)

哪种方法更好,为什么?

algorithm data-science normal-distribution outliers
1个回答
1
投票

这完全取决于您的应用程序。

话虽如此,第二种方法看起来像一个标准(有些人称之为天真)解决方案。第一种方法看起来很奇怪,只是关闭:

想象一下,只有两个交替的数字进来。假设0和10.过了一会儿,你将有一个非常稳定的5 + - ε平均值(ε收敛0)。因此,随着您的进步,这些方法的标准偏差将变得越来越小。最终,3σ将小于5,并且从那时起所有传入的数字将是异常值。

© www.soinside.com 2019 - 2024. All rights reserved.