Julia DataFrames独特的行

Question

在DF中，我有两列（让我们称之为A和B），A有重复，两者都是分类变量。我试图只显示具有相应B值的唯一A行，我该怎么做？

当B是连续变量时我能够通过使用它来做到这一点：

by(ptable, [:A], df -> mean(df[:B]))

Answer 1

你可以得到这样的结果：

by(df, :A, x -> [x.B])

现在你的DataFrame将有两列:A和:x1，列:x1将保存对应于:B的唯一值的列:A的所有值（因此列:x1将是向量的向量）。

Answer 2

这对我有用

df[!nonunique(df[:,[:A]]), [:A, :B]]