我被困在尝试根据条件获取先前的值

问题描述 投票:1回答:1

我是FeatureTools库的新手,尝试创建两种类型的功能时遇到了麻烦,两者都与获取先前的值有关。一个是'QUANTIDADE''VALOR_TOTAL''DATA_NOTA'的先前值本身,另一个是自先前观察以来的时间(天),其中以'DATA_NOTA'作为日期字段。

我不知道是否可以使用FeaturelTools做到这一点。如果有人可以帮助我,我将不胜感激。

我有以下数据框(df):enter image description here

当我标准化以上df时,它采用以下基本架构:

enter image description here

正如我所说,我想获取自从'QUANTIDADE''VALOR_TOTAL''DATA_NOTA'的上次观察以来的先前值和时间,但是当'CODIGO_PRODUTO''CODIGO_CLIENTE'的组合匹配时。

feature-extraction featuretools
1个回答
0
投票

[进行了一些研究之后,我发现可以使用groupby_trans_primitives来完成所需的操作,如下:

from featuretools.primitives import TimeSincePrevious
time_since_previous = TimeSincePrevious(unit = "days")

fm, features = ft.dfs(entityset=es, 
                      target_entity='recordings',
                      trans_primitives = [],
                      agg_primitives = [],
                      max_depth=2,
                      verbose=True,
                      groupby_trans_primitives=['Diff',time_since_previous])
© www.soinside.com 2019 - 2024. All rights reserved.