当重复时如何使用2个条件映射值

Question

如何基于两个条件（月和id）进行成本归因。

问题是.. id每个月重复一次，但是每个月的花费都不同

所以如何通过2个条件（id和month）将这些值从reff表映射到主数据帧

总体上有重复项，但某月没有重复项。

我的数据样本

cw=

  adgroup    Date    
  1001   2018-08-01
  1001   2019-03-01
  1003   2018-03-01
  1002   2018-03-01
  1001   2018-05-01
  1003   2018-08-01
  1001   2019-12-12
  1002   2019-03-01
  1001   2019-08-01

参考表

f_spend=


    adgroup   Month        cost  

    1001    2019/08     101,1
    1002    2019/08      70,1
    1003    2019/03    4221,1
    1001    2018/05     101,1
    1002    2018/03      50,1
    1003    2018/08    8221,1
    1001    2019/08    5401,1
    1002    2019/08      50,1
    1003    2019/12    9221,1
    1001    2019/08     101,1
    1002    2019/08      50,1
    1003    2019/12    6221,1

我做了什么

# grouping by the main data( facebook data) by id

cw["id"].replace(to_replace=[None], value=np.nan, inplace=True)

grouped_cw = cw.groupby(["adgroup"]).sum()
grouped_cw = pd.DataFrame(grouped_cw)



# merging two tables together

f_spend = f_spend.merge(grouped_cw, left_on='adgroup', right_index=True)
f_spend["cost"] = pd.to_numeric(f_spend["cost"])



# mapping values to original data
cw['spent'] = cw['adgroup'].map(f_spend.set_index('adgroup')['cost'])

无法工作，因为我已经重复了，但是我不应该删除它们

Answer 1

似乎在您的代码的这一部分：

# merging two tables together
f_spend = f_spend.merge(grouped_cw, left_on='adgroup', right_index=True)
f_spend["cost"] = pd.to_numeric(f_spend["cost"])

# mapping values to original data
cw['spent'] = cw['adgroup'].map(f_spend.set_index('adgroup')['cost'])

您不应该使用广告组，应该使用“月/日期”列执行联接，因为日期是数据中每个事件唯一的部分。

当重复时如何使用2个条件映射值

问题描述投票：0回答：1

如何基于两个条件（月和id）进行成本归因。

问题是.. id每个月重复一次，但是每个月的花费都不同

无法工作，因为我已经重复了，但是我不应该删除它们

1个回答

最新问题

当重复时如何使用2个条件映射值

问题描述 投票：0回答：1

如何基于两个条件（月和id）进行成本归因。

问题是.. id每个月重复一次，但是每个月的花费都不同

无法工作，因为我已经重复了，但是我不应该删除它们

1个回答

最新问题

问题描述投票：0回答：1