我有一个包含三列的数据集(客户ID,交易,日期)。客户ID与交易之间存在一对多的关系。我想添加一个新列,其中包含每个唯一客户ID的最早购买数据。我尝试了以下逻辑,但
df ['首次购买日期'] = df.loc [df.groupby('CustomerID')。Date.idxmin(),:]
当我运行此代码时,我收到一条错误消息:在处理上述异常期间,发生了另一个异常:然后以Value错误结束。
是否有一种简单的方法可以在给定另一列中的条件的情况下找到该列中最早的数据?
我们通常使用transform
df['First Purchase Date'] = df.groupby('CustomerID').Date.transform('idxmin')