我需要删除每个组的最后一个成员,因为这会使进一步的计算混乱。我不知道如何更好地解释我的问题,但是如果您需要进一步说明,请询问。
我当前的代码:
sampleDataUser = sampleData.groupby('user').filter(lambda x: x != sampleDataUser.tail(1))
返回此错误:
ValueError: Can only compare identically-labeled DataFrame objects
样本数据:
df = [{ "user" : "seth", var1 = "5"}, {"user": "seth", "var1" : "8"}, {"user" : "chris", "var1" : "2"}]
预期输出:
df = [{ "user" : "seth", var1 = "5"}, {"user" : "chris", "var1" : "2"}]
如果重复则删除user
的最后一行,使用Series.duplicated
链接的Series.duplicated
表示按位|
的掩码,并按OR
进行过滤:
boolean indexing
详细信息:
boolean indexing