我有一个数据框,每个“PROGRAM”、“VERSION”和“RELEASE_DATE”列的组合都有很多行。我想获得一个数据框,其中包含这三列的所有组合。这是
groupby
或distinct
的工作吗?
谢谢
因为你没有聚合任何东西,使用
unique
df.select(['PROGRAM','VERSION','RELEASE_DATE']).unique()
如果你没有使用 Polars 的 Lazy 功能,这也可以写成:
df[['PROGRAM','VERSION','RELEASE_DATE']].unique()