我是FeatureTools库的新手,尝试创建两种类型的功能时遇到了麻烦,两者都与获取先前的值有关。一个是'QUANTIDADE'
,'VALOR_TOTAL'
和'DATA_NOTA'
的先前值本身,另一个是自先前观察以来的时间(天),其中以'DATA_NOTA'
作为日期字段。
我不知道是否可以使用FeaturelTools做到这一点。如果有人可以帮助我,我将不胜感激。
当我标准化以上df时,它采用以下基本架构:
正如我所说,我想获取自从'QUANTIDADE'
,'VALOR_TOTAL'
和'DATA_NOTA'
的上次观察以来的先前值和时间,但是当'CODIGO_PRODUTO'
和'CODIGO_CLIENTE'
的组合匹配时。
[进行了一些研究之后,我发现可以使用groupby_trans_primitives
来完成所需的操作,如下:
from featuretools.primitives import TimeSincePrevious
time_since_previous = TimeSincePrevious(unit = "days")
fm, features = ft.dfs(entityset=es,
target_entity='recordings',
trans_primitives = [],
agg_primitives = [],
max_depth=2,
verbose=True,
groupby_trans_primitives=['Diff',time_since_previous])