pandas python删除组的最后一行

Question

我需要删除每个组的最后一个成员，因为这会使进一步的计算混乱。我不知道如何更好地解释我的问题，但是如果您需要进一步说明，请询问。

我当前的代码：

 sampleDataUser = sampleData.groupby('user').filter(lambda x: x != sampleDataUser.tail(1))

返回此错误：

  ValueError: Can only compare identically-labeled DataFrame objects

样本数据：

df = [{ "user" : "seth", var1 = "5"}, {"user": "seth", "var1" : "8"}, {"user" : "chris", "var1" : "2"}]

预期输出：

df = [{ "user" : "seth", var1 = "5"}, {"user" : "chris", "var1" : "2"}]

Answer 1

如果重复则删除user的最后一行，使用Series.duplicated链接的Series.duplicated表示按位|的掩码，并按OR进行过滤：

boolean indexing

详细信息：

boolean indexing