熊猫插值方法的差异

问题描述 投票:0回答:2

我需要检查插值的“索引”方法和插值的“线性”方法之间的区别

我创建了一个带有缺失值的随机熊猫系列,然后用线性方法和索引方法检查了插值结果

但他们两个都返回相同的结果。那么,它应该返回相同的结果吗?如果是的话,在什么情况下我可以看到不同的结果?

s = pd.Series([21,13,np.nan,152,np.nan,46,98])
s.interpolate(method = 'index')
s.interpolate(method = 'linear')

我得到以下结果:

s.interpolate(method = 'index')
0     21.0
1     13.0
2     82.5
3    152.0
4     99.0
5     46.0
6     98.0
dtype: float64


s.interpolate(method = 'linear')
0     21.0
1     13.0
2     82.5
3    152.0
4     99.0
5     46.0
6     98.0
dtype: float64

python pandas interpolation
2个回答
2
投票

当你的indexrange或具有相同的间隙指数而线性将产生相同的结果时,请尝试使用下面的示例

s = pd.Series([21,13,np.nan,152,np.nan,46,98],index=[0,1,3,4,7,9,10])
s.interpolate(method = 'index')
Out[536]: 
0      21.000000
1      13.000000
3     105.666667
4     152.000000
7      88.400000
9      46.000000
10     98.000000
dtype: float64
s.interpolate(method = 'linear')
Out[537]: 
0      21.0
1      13.0
3      82.5
4     152.0
7      99.0
9      46.0
10     98.0
dtype: float64

2
投票

linearindex方法都将对系列进行线性插值;不同之处在于将哪些值视为自变量:

  • method = 'index'使用数字索引值(如果您的系列没有指定索引,则默认为0,1,2,...,n - 1)
  • method = 'linear'将系列的元素视为等间距(不考虑索引中指定的任何值);这当然等同于使用序列0,1,2,...,n - 1作为独立变量范围

因此,对于索引是默认值(或任何其他算术级数,例如0,2,4,6 ......)的任何系列,这两个选项都将产生相同的结果。

© www.soinside.com 2019 - 2024. All rights reserved.