我有一个pandas数据框df
df:
GROUP VALUE
1 5
2 2
1 10
2 20
1 7
我试图在其中一个列上应用以下功能
import pandas as pd
from statsmodels import robust
import numpy as np
def madout(x):
mad = robust.mad(x)
median = np.median(x)
mad_s = (abs(x - median / mad))
return mad_s
df.VALUE.apply(madout)
但是尽管我多次尝试都收到错误
AxisError:轴0超出了0维数组的范围。请帮忙
apply
将该函数应用于列df.VALUE
的每个元素。
我认为你在寻找的是:
In [8]: madout(df.VALUE)
Out[8]:
0 3.426191
1 0.426191
2 8.426191
3 18.426191
4 5.426191
Name: VALUE, dtype: float64