在DF中,我有两列(让我们称之为A和B),A有重复,两者都是分类变量。我试图只显示具有相应B值的唯一A行,我该怎么做?
当B是连续变量时我能够通过使用它来做到这一点:
by(ptable, [:A], df -> mean(df[:B]))
你可以得到这样的结果:
by(df, :A, x -> [x.B])
现在你的DataFrame
将有两列:A
和:x1
,列:x1
将保存对应于:B
的唯一值的列:A
的所有值(因此列:x1
将是向量的向量)。
这对我有用
df[!nonunique(df[:,[:A]]), [:A, :B]]