正如我的问题所述,我想在运行时调用自定义函数到数据框。自定义功能的用途是计算两个日期(即年龄)之间的差,将年转换为月,从两列中找到最大-最小等。
[到目前为止,我成功地执行了算术运算,并执行了一些函数,如abs(),sqrt(),但无法使min()-max()正常工作。
df.eval('TT = sqrt(Q1)',inplace=True)
df.eval('TT1 = abs(Q1-Q2)',inplace=True)
df.eval('TT2 = (Q1+Q2)*Q3',inplace=True)
以下代码与eval一起使用。如何在dataframe eval中使用相同的内容?
def find_max(x,y):
return np.maximum(x,y)
eval('max1')(4,7)
def find_age(date_col1,date_col2):
return 'I know how to calc age but how to call func this with df.eval and assign to new col'
示例数据框:
op_d = {'ID': [1, 2,3],'V':['F','G','H'],'AAA':[0,1,1],'D':['2019/12/04','2019/02/01','2019/01/01'],'DD':['2019-12-01','2016-05-31','2015-02-15'],'CurrentRate':[7.5,2,2],'NoteRate':[2,3,3],'BBB':[0,4,4],'Q1':[2,8,10],'Q2':[3,5,7],'Q3':[5,6,8]}
df = pd.DataFrame(data=op_d)
感谢您的任何帮助或指向Doc的链接。
我找到但没有解决我的问题的有用链接是:
Dynamic Expression Evaluation in pandas using pd.eval()
Using local variables with multiple assignments with pandas eval function
可以像往常一样调用函数,您需要使用@
synbol来引用它们:
df
A B
0 1 0
1 0 0
2 0 1
def my_func(x, y): return x + y
df.eval('@my_func(A, B)')
0 1
1 0
2 1
dtype: int64
当然,这里的期望是您的函数期望将系列作为参数。否则,根据需要将函数包装在对np.vectorize
的调用中。