两个包含异常值的数据集之间的偏移量

问题描述 投票:1回答:1

说我有以下要点,按时间戳排序:

A = [10, 10, 10, 20, 15, 15, 5, 25]
B = [5, 5, 15, 10, 10, 0, 0, 20]

我正在尝试在两个数组之间匹配元素,假设存在一些未知的偏移量以及一些不匹配的地方。如果仅考虑这些数组的差值,我将得到:

C = A - B = [5, 5, -5, 10, 5, 15, 5, 5]

并没有显示太多模式。但是,如果我意识到省略A[2]B[6],我将拥有:

A = [10, 10, 20, 15, 15, 5, 25]
B = [5, 5, 15, 10, 10, 0, 20]
C = [5, 5, 5, 5, 5, 5, 5]

关于如何找到此偏移量的任何想法(在这种情况下为5)?它不一定是中位数,我也不希望它简单地成为模式,因为解决方案应该扩展到偏移量在较小范围内(例如4.5至5.5之间)的情况。我当时以为RANSAC(系数a = 1)可能会有所帮助,但不太确定。谢谢

timestamp regression offset matching ransac
1个回答
-1
投票

我尝试使用“稳健”回归,其中我使用误差绝对值的最低总和而不是标准平方误差的总和来拟合数据的直线。使用您的A和B值以及直线方程“ B = a +(b * A)”,得出a和b的拟合值:

a = -4.9999999999999991E+00
b =  1.0000000000000000E+00

实际上是“ B = A-5”

plot

© www.soinside.com 2019 - 2024. All rights reserved.